更強大的“谷歌大腦”,谷歌擴充機器神經(jīng)網(wǎng)絡(luò)規(guī)模
“機器學習”的概念自上世紀50年代出來以來就備受科技界的關(guān)注,而近年來“深度學習”逐漸成為機器學習研究中的一個新的領(lǐng)域,其動機在于建立、模擬人腦進行分析學習的神經(jīng)網(wǎng)絡(luò),模仿人腦的機制來識別圖像、聲音和文本等數(shù)據(jù)。
美國科技媒體《連線》雜志網(wǎng)絡(luò)版日前發(fā)文對“機器深度學習”技術(shù)的最新進展進行了總結(jié)。以下是文章的主要內(nèi)容。
在Quoc Le的眼中,世界都是由一系列的數(shù)字組成的。“一張數(shù)碼照片實際上都是數(shù)字,”他說道,“如果將人們所說的話拆分成單獨的音素,那么它們同樣可以被編譯成數(shù)字。”如果按照Quoc Le的說法,就可以將這些數(shù)字輸入到機器之中,機器能夠讀懂照片和人們所說的話,比如Facebook能夠識別出你的臉,谷歌則能夠聽懂你所說的話。
不過Quoc Le想要走得更遠,他希望能夠研究出一種能將整個句子、整個段落以及各種類型的自然語言轉(zhuǎn)譯成數(shù)字或其它載體的技術(shù),借助這項技術(shù),計算機科學家就可以讓機器也能夠獲得人們看到和聽到的信息。同時,Quoc Le還在探索如何讓機器理解人們的觀點和情緒的方法。
盡管此類技術(shù)目前尚處于起步階段,未來還有很長的路要走,但相對于同行而言,Quoc Le要擁有更多供其調(diào)配的資源。Quoc Le是“谷歌大腦”(Google Brain)項目的一員,該項目主要從事“機器深度學習”領(lǐng)域的研究,這是人工智能的一種形式,主要用機器來模擬人腦進行數(shù)據(jù)處理。
現(xiàn)年32歲的Quoc Le一直在谷歌從事語音識別方面的工作,比如Android系統(tǒng)的語音識別功能以及為網(wǎng)絡(luò)圖片自動添加標簽等,這兩項工作都需要“深度學習”技術(shù)的支持。
除了谷歌之外,F(xiàn)acebook和微軟等互聯(lián)網(wǎng)巨頭也都在使用“深度學習”方面的技術(shù),同時百度公司最近也曾在公開場合談及利用這項技術(shù)來為客戶提供更為精確的廣告推送服務(wù)。不過Quoc Le希望將該技術(shù)推向更為廣闊的領(lǐng)域,包括對自然語言理解、機器人以及網(wǎng)絡(luò)搜索等。
Quoc Le最近開發(fā)出了一項“深度學習”技術(shù),能夠鑒別出網(wǎng)絡(luò)上不同的詞匯之間是如何關(guān)聯(lián)的,谷歌則在自己的“知識圖譜”中融入這項技術(shù),從而幫助其對搜索結(jié)果進行知識系統(tǒng)化,讓每一個關(guān)鍵詞都能獲得完整的知識體系。
曾經(jīng)的困擾
Quoc Le上世紀90年代首次接觸到人工智能,但是確實讓他感到煩惱不已,因為當時的機器學習系統(tǒng)非常依賴工程師的手工輸入,盡管機器在一定程度上也具備理解能力,但是卻需要比較繁瑣的操作才能完成。比如當時的機器在照片沒有添加標簽的情況下就無法對其進行識別。
“我們對大量無標簽的數(shù)據(jù)進行了學習研究,”Quoc Le說道,他曾與“谷歌大腦”項目的創(chuàng)始人之一吳恩達(Andrew Ng)在斯坦福大學共同研究人工智能,“如果未來我們能夠找到一種可行的算法來讓機器對無標簽的數(shù)據(jù)進行識別,那將有可能會改變整個計算行業(yè),畢竟現(xiàn)在網(wǎng)絡(luò)的大部分數(shù)據(jù)(如Facebook、Twitter和谷歌)都是沒有標簽的。”
這也正是“深度學習”技術(shù)未來想要實現(xiàn)的目標。利用數(shù)萬臺電腦通過軟件模擬人腦中的神經(jīng)元網(wǎng)絡(luò),從而讓機器獲得與人類相似的學習能力,比如在某些情況下機器能夠在無需對數(shù)據(jù)添加標簽的情況下實現(xiàn)自動學習。
谷歌的貓臉識別其實就是“深度學習”技術(shù)的典型案例,只不過在經(jīng)過了長達三年的研發(fā)之后,這個項目仍然沒能獲得大的進展。與此同時,大部分商業(yè)深度學習系統(tǒng)目前仍然比較依賴人工監(jiān)控。“盡管貓臉識別技術(shù)的實用性很低,”吳恩達說道,“但是我認為這項技術(shù)代表是深度學習未來發(fā)展的一個方向。”
語言的挑戰(zhàn)
“深度學習”技術(shù)需要面臨的另一個挑戰(zhàn)是對自然語言的識別。人類的語言中包含大量的微妙信息,迄今為止科學界還未能找到識別這些微妙信息的方法。比如一個相同的詞匯,在不同的語境或語氣下都會有不同的意思,目前大部分人工智能系統(tǒng)都無法區(qū)分這些信息。“機器非常善于處理數(shù)據(jù),但是卻無法應(yīng)付語言符號,”Quoc Le介紹說,“因為語言是一種具備高度象征意義的東西。”
對語言進行識別的關(guān)鍵是找到將符號轉(zhuǎn)譯成數(shù)字的方式。“目前我們還沒有找到將語言概念轉(zhuǎn)變成機器能夠處理的數(shù)學結(jié)構(gòu)的方法,”Quoc Le說道,“不過在與Word2Vec工具的幫助下,我們在這方面也取得了一定進展。希望未來我們的機器能夠自動識別發(fā)布在網(wǎng)絡(luò)上的海量信息。”
“人們未來是不可能隨時隨地監(jiān)督機器的學習的,”與Quoc Le一起在斯坦福大學攻讀博士學位的理查德索切(Richard Socher)說道,“我們希望未來能夠?qū)⒈O(jiān)督學習和非監(jiān)督學習結(jié)合起來,這樣機器就能實現(xiàn)許多目前難以想象的事情。”
Quoc Le最近聯(lián)合谷歌的幾位同事發(fā)表了一篇關(guān)于在深度神經(jīng)網(wǎng)絡(luò)研究中使用機器翻譯的文章,其中談到了對“回歸神經(jīng)網(wǎng)絡(luò)”的利用,據(jù)了解這可能是目前語言識別領(lǐng)域最為先進的技術(shù)。
更強大的“谷歌大腦”
Quoc Le在文章中表示,他們所發(fā)現(xiàn)的新方法要優(yōu)于其它機器翻譯算法,不過這也僅僅是“深度學習”的一個應(yīng)用而已,未來“深度學習”技術(shù)還將會用于網(wǎng)絡(luò)上的問題答疑、自動說明以及情感分析等等。
為了充分利用這些先進的算法,谷歌將不得擴充自己的“機器神經(jīng)網(wǎng)絡(luò)”規(guī)模,而不是局限在圖像和語音的識別領(lǐng)域。“深度學習”概念的奠基人、目前供職于谷歌的杰夫·韓?。℅eoff Hinton)曾在介紹“谷歌大腦”項目時表示:“就像是鴿子的大腦一樣,雖然它擁有良好的視力,但是任何人都不會與一只鴿子進行對話。”
實際上,即便是腦容量相當小的鴿子,其大腦的計算能力也能夠輕松超越目前世界上最為先進的“機器神經(jīng)網(wǎng)絡(luò)”(包括“谷歌大腦”),而在韓丁加盟谷歌之后,更是宣稱未來要幫助谷歌打造全球最大的“機器神經(jīng)網(wǎng)絡(luò)”來對“深度學習”進行更加全面的研究。