AlphaGo之父: 先解決智能 再用智能解決一切
當全世界的創(chuàng)業(yè)者以為最前沿的技術(shù)創(chuàng)新來自硅谷時,一家創(chuàng)造出了AlphaGo的英國公司DeepMind成為了人工智能領(lǐng)域里最耀眼的明星。
得米斯·哈薩比斯(DemisHassabis)就是那個站在AlphaGo背后的“超級英雄”。
今年5月,這個擁有1/4中國血統(tǒng)的AI明星第一次來到中國,在烏鎮(zhèn)發(fā)布會場間走來走去的他身邊總是圍繞著一群工作人員,到處是握手、合影、簽名……其間,他還做了一場關(guān)于“AlphaGo究竟是什么”的演講。
當他走進記者臨時布置的采訪間時,很隨和地就和記者CEO周健工搭上了話,聊起了圍棋和阿爾法狗,以及外界看起來頗為神秘的DeepMind公司。
40歲的他,有些謝頂,像極了中國普通高校里的老師。但當他說起自己的使命是“讓人工智能成為探索宇宙的‘終極工具’”時,沒有人會懷疑他的認真。
他被互聯(lián)網(wǎng)發(fā)明者TimBernersLee稱為“地球上最聰明的人類之一”,還被英國媒體譽為人工智能時代的“超級英雄”。
他創(chuàng)辦的DeepMind在2014年被谷歌以6億美元收購,并在此后影響了谷歌未來十年的發(fā)展方向,促使谷歌的戰(zhàn)略從移動先行轉(zhuǎn)向AI先行。
在人工智能領(lǐng)域,最讓他興奮的兩件事,一個是深度學習,另一個是強化學習,AlphaGo正是二者的結(jié)合,也是邁向通用人工智能目標的重要一步。哈薩比斯說:“現(xiàn)在先解決智能,再用智能去解決一切。”
從神童到AlphaGo
5月27日,人機大戰(zhàn)三番棋最后一役,AlphaGo與當今排名世界第一的中國年輕圍棋大師柯潔的總比分最終定格在了3∶0。
半個小時后,站在臺上的哈薩比斯和柯潔握手、相擁,現(xiàn)場的掌聲久久沒有停息。
“這大概就是天才與天才之間的惺惺相惜吧!”一位現(xiàn)場的工作人員感慨道。
哈薩比斯稱得上是“少年天才”。他喜歡各類智力游戲,從4歲開始下國際象棋,13歲時就獲得了國際象棋大師稱號,至今仍然保持著5次獲得“智力奧運會”精英賽冠軍的世界紀錄。
11歲去列支敦士登參加一場一場國際巡回賽,令少年哈薩比斯印象深刻。
當時的他和一個丹麥冠軍棋手對局,下到10個小時的時候,哈薩比斯剩下王和后,對方剩王、車和象,并占有優(yōu)勢。這場比賽本可以平局結(jié)束,但哈薩比斯太累了,選擇了認輸。
哈薩比斯在BBC一檔節(jié)目中回憶,這場比賽讓他生出了一種頓悟——“我們是不是在浪費大腦,既然這個級別的比賽選手都是頂尖的,為什么不用我們的腦力去做點更有意義的事情,比如解決癌癥問題,找到其他疾病的治愈方法,不是更好嗎?”
當時,哈薩比斯在同年齡段棋手中排名世界第二,身邊幾乎所有人都想當然地以為這將是他未來的職業(yè)。不過,哈薩比斯并沒有從此走上職業(yè)棋手的道路,而是對計算機產(chǎn)生濃厚的興趣。
在學校里,幾個朋友和哈薩比斯組成了黑客俱樂部,一起寫代碼,做影像演示,復制曾看過的電影或玩過的游戲,所有的業(yè)余時間都花在了怎么用這些電腦更好地編程。
20歲時,哈薩比斯獲得劍橋大學計算機科學學位,之后成立視頻游戲公司Elixir。他評價,成功的游戲都會從一個側(cè)面反映生活,從中學到很多東西,“生活不允許我們一直追求安穩(wěn),需要不斷激發(fā)我們產(chǎn)生新的想法,改進策略,開發(fā)自己的大腦,而游戲像是大腦體操。”
此后,哈薩比斯又選擇回歸學術(shù),在倫敦大學學院攻讀神經(jīng)科學博士學位,完成海馬體和情景記憶學術(shù)研究,并在2011年與人工智能專家同事ShaneLegg、連續(xù)創(chuàng)業(yè)者MustafaSuleyman一起創(chuàng)立DeepMind團隊。
作為“異于常人”的天才,哈薩比斯有著自己獨特的“生物鐘”:上午10點開始工作,花一整天在DeepMind辦公室,回去和家人一起吃晚飯,然后在晚上10點開始第二天的工作,直到早上4點才去睡覺。通常,他會在夜里的幾個小時進行研究,讀最新的學術(shù)論文,以及創(chuàng)造性地思考。
2014年,谷歌以6億美元的價格收購DeepMind,這是當時谷歌在歐洲進行的最大手筆收購案,而那時的DeepMind還沒公開發(fā)布過任何產(chǎn)品,只有20個技術(shù)人員。
有了谷歌的“加持”,DeepMind加速了對AlphaGo的研發(fā)。直到去年3月,AlphaGo以4∶1的成績戰(zhàn)勝了曾經(jīng)排名世界第一的圍棋選手李世石,被視作人工智能發(fā)展史上的歷史性突破。
在學術(shù)領(lǐng)域,DeepMind也證明了它的價值:2015年2月,DeepMind在科學雜志《自然》上發(fā)表論文,介紹了能夠通過學習成為雅達利(現(xiàn)代游戲機始祖)游戲高手的人工主體。去年1月,DeepMind再次發(fā)表論文,稱他們的新算法AlphaGo在圍棋上取得巨大突破。哈薩比斯在管理DeepMind之余,還同時在世界頂級科學大會上發(fā)表了4篇論文。
而這些豐富的經(jīng)歷,或許與哈薩比斯的家庭教育不無關(guān)系。“我的背景很多元化。”哈薩比斯在接受記者獨家采訪時說,他的父親有著希臘和塞浦路斯血統(tǒng),年輕時是一位創(chuàng)作歌手,而母親則出生自新加坡籍華人,他們都喜歡按自己的喜好做事,這對他的影響是——“不要循規(guī)蹈矩,走自己的路,并且一直走下去,那才是生活的正確方式。”
給聰明人一個機會
在一次TED大會上,時任谷歌CEO的LarryPage談起哈薩比斯時滔滔不絕,并且把DeepMind稱為“很長一段時間以來,我見到過的最令人興奮的東西之一”。
而哈薩比斯所帶領(lǐng)的DeepMind在人工智能領(lǐng)域取得的成功,顯然已經(jīng)說服了谷歌,是時候把研究人工智能當作公司的首要目標了。
“我們很高興能證明,最前沿的科技并不僅僅存在于硅谷中。我為自己是一個英國人,并且扛起英國的創(chuàng)新旗幟而感到自豪。”哈薩比斯對記者說。
在他眼里,英國一直以來都有研究電腦科技和人工智能的創(chuàng)新傳統(tǒng),例如阿蘭·圖靈和“互聯(lián)網(wǎng)之父”蒂姆·伯納斯·李。只不過,也許大家不那么擅長把科技轉(zhuǎn)化為商業(yè)上的成功。
“很多地方都能做前沿研究,就像倫敦和中國,為什么不呢?只要你有足夠多的聰明人,并且給他們一個機會。”哈薩比斯說。
站在哈薩比斯和DeepMind身后的,就是一群來自超過60個國家最聰明的人才,不斷地解決人工智能領(lǐng)域最有趣的挑戰(zhàn)。
他告訴記者記者,目前DeepMind倫敦有400到500名員工。其中有超過200名頂尖博士和科學家。
如何吸引這些頂尖人才從世界各地來到DeepMind,哈薩比斯笑著說:“最頂尖的人總是想和世界上其他頂尖的人一起工作。”特別是當你開始做出AlphaGo這樣的產(chǎn)品,或是在《自然》雜志上發(fā)表研究成果,就是向世界上最好的人才打出了廣告,“如果他們想做出像AlphaGo這樣偉大的產(chǎn)品,那么DeepMind就是一個工作的好地方。”
另一方面,這些頂尖人才往往想要研究最有趣的問題,接受最有趣、最智慧的挑戰(zhàn)。哈薩比斯認為,解決人工智能問題就是你能干的最有趣的事兒之一,所以對那些聰明絕頂?shù)娜藖碚f,研究中遇到的挑戰(zhàn)也是非常有趣的。
第三個原因,則歸功于DeepMind創(chuàng)造出的獨特的研究文化,這是一種學術(shù)院實驗室和初創(chuàng)公司模式的混合體,DeepMind嘗試著吸取兩邊的精華,并把它們結(jié)合起來。
哈薩比斯說,這種混合文化涉及DeepMind所做的每一件事,包括面試流程、管理流程、項目管理……所有這些都是為了促進研究盡可能快地取得成果而特別設(shè)計的。例如,在學術(shù)院實驗室做研究,往往不太可能擁有在初創(chuàng)公司工作的能量和快節(jié)奏;而初創(chuàng)公司常常遇到的問題是目標不夠遠大,也沒有足夠的雄心來完成想做的研究,DeepMind要做的就是把這兩方面融合在一起。
而這種人才國際化的好處是:不同文化背景的人才、不同的思維方式也隨之而來。“我認為這對科研項目有很大的幫助,因為采納盡可能多維度的觀點有助于你找到客觀的前進方向。”
可以說,DeepMind充斥著博士和拿著頂尖學府的頂尖文憑的人才。不過,如果大學輟學的史蒂夫·喬布斯生活在人工智能時代,他會成功嗎?
面對這個問題,哈薩比斯的回答是:很有可能。
“你說得對,我們這里大多數(shù)人都有著頂尖文憑,但是他們中也有一些人并沒有,他們是自學成才的,尤其是在工程領(lǐng)域,他們也做出了杰出的貢獻。”哈薩比斯認為因人而異,“一個像史蒂夫·喬布斯這樣非凡的人無論嘗試做什么都能成功。”
圍棋界的“哈勃天文望遠鏡”
圍棋起源于中國,已經(jīng)流傳了近3000年。2016年春天,AlphaGo與世界圍棋選手李世石的一場世紀人機大戰(zhàn),標志著人工智能取得了歷史性的突破,更引發(fā)了一波人工智能創(chuàng)業(yè)熱。
一年之后,高智能的機器來到中國,打敗了中國的頂尖選手。
人機大戰(zhàn)最后一役,柯潔局中落淚,賽后哽咽,說AlphaGo太完美,完美到?jīng)]有希望。
在講解棋局時,“棋圣”聶衛(wèi)平對于AlphaGo的稱呼從阿爾法狗到阿爾法圍棋,最后再到“阿老師”。
在圍棋業(yè)余一段左右水平的哈薩比斯看來,“這就像人們利用哈勃望遠鏡發(fā)現(xiàn)新的宇宙空間一樣。AlphaGo就是圍棋界的‘哈勃天文望遠鏡’。”
圍棋看似規(guī)則簡單,復雜性卻是難以想象的。它一共有10的170次方種可能性,這個數(shù)字比整個宇宙中的原子數(shù)10的80次方都多,沒有辦法窮舉出圍棋所有可能的結(jié)果。
更困難的是,圍棋不像象棋等游戲靠計算,而是要靠直覺。“圍棋中沒有等級概念,所有棋子都一樣,圍棋是筑防游戲,因此需要盤算未來。你在下棋的過程中,是棋盤在心中,必須要預測未來。小小一個棋子可撼動全局,牽一發(fā)動全身。圍棋‘妙手’如受天啟。”哈薩比斯解釋道。
人機大戰(zhàn)已經(jīng)落幕,但人類圍繞人工智能的探索才剛剛起步。
AlphaGo已經(jīng)展示出了創(chuàng)造力,在某一個領(lǐng)域它甚至已經(jīng)可以模仿人類直覺了。在不遠的將來,它是否會擁有獨立學習機制并產(chǎn)生獨立的動機?甚至進化出情緒識別能力,通過判斷柯潔的表情來故意輸給柯潔?
哈薩比斯大笑著說:“也許我們確實應(yīng)該裝上一套判斷系統(tǒng)。”但事實上,在訓練AlphaGo的過程中,接觸到職業(yè)棋手的機會非常少,大多數(shù)情況下都是自我學習。
他告訴記者記者,目前AlphaGo不能自己設(shè)定自己的目標,而是需要開發(fā)人員在設(shè)計系統(tǒng)的時候給它定個目標。這就像AlphaGo的目標不是開車或是其他,只知道開發(fā)人員給它定的目標,那就是贏得圍棋比賽。
他說,在可預見的將來,人工智能系統(tǒng)會被設(shè)計成實現(xiàn)設(shè)計者既定目標的工具。怎么去實現(xiàn)目標,也可以讓機器來學習。“一般說來,我認為這些系統(tǒng)都會竭盡所能去實現(xiàn)我們設(shè)定的目標。”
AlphaGo的“星辰大海”
去年3月谷歌AlphaGo戰(zhàn)勝人類棋手時,搜狗CEO王小川給公司放了一天假,慶祝人工智能的歷史性突破。
3個月后,王小川曾去英國倫敦拜訪DeepMind,問當時機器輸?shù)舻谒木制鍟r究竟發(fā)生了什么?“不是程序有BUG,就是深度學習本身有瓶頸。”但對方用了3個月去復盤仍沒有給出解決的答案。這給王小川留下一個深刻的印象,深度學習還是存在瓶頸的。
AlphaGo距離強人工智能,甚至超人工智能還有多遠?
哈薩比斯對記者說,這像在科幻片里的一些超級人工智能,我們離那個目標還很遙遠,至少還有幾十年的路要走,“因為有關(guān)于人工智能方面的一些關(guān)鍵的問題,我們還沒有攻克下來。”
他對記者坦言,圍繞AlphaGo,背后的技術(shù)包括圖像處理、大數(shù)據(jù)分析等,目前在其他領(lǐng)域的使用還在早期探索階段,只在AlphaGo研究的中間環(huán)節(jié)某些領(lǐng)域應(yīng)用,但是在未來肯定會在多個領(lǐng)域推廣相關(guān)的技術(shù)。
在AlphaGo剛剛獲封中國圍棋九段后,哈薩比斯宣布它將退出競技比賽的舞臺,AlphaGo的研發(fā)團隊將把精力投入到其他重大挑戰(zhàn)中,研發(fā)出高級通用算法,為科學家們解決最復雜的問題提供幫助,包括找到新的疾病治療方法、顯著降低能源消耗、發(fā)明革命性的新材料等。
“如果人工智能能夠在上述領(lǐng)域發(fā)現(xiàn)新的知識和策略,那在這些領(lǐng)域的突破將十分可觀。我們已經(jīng)迫不及待地想看到這一切的發(fā)生。”包括哈薩比斯在內(nèi)的DeepMind高管在博客中說。
去年夏天,谷歌已經(jīng)把DeepMind人工智能接入谷歌數(shù)據(jù)中心,來幫助這家巨無霸公司節(jié)省能源開支。據(jù)說,節(jié)省下來的開支作為它2014年收購DeepMind的部分支付款項。
此外,哈薩比斯舉例,通過與人類專家的合作,可以找到各種各樣的創(chuàng)新方式,包括把AlphaGo的其中一種變體應(yīng)用于醫(yī)療行業(yè),正在著力解決蛋白質(zhì)折疊的問題,用來治療阿爾茲海默癥。”
“人機合作可以達到1+1大于2的效果,人類的智慧將被人工智能放大。人工智能和AlphaGo都是工具,就像哈勃望遠鏡一樣,可以推進人類文明的進步。”
而人工智能和所有強大的新技術(shù)一樣,都是在倫理和責任的約束中造福人類。哈薩比斯認為,“人工智能應(yīng)該是應(yīng)用于科學、制藥等領(lǐng)域,而不是應(yīng)用于研發(fā)武器、戰(zhàn)爭上。”
不過,當人工智能的大潮涌來,不難看到數(shù)據(jù)、人才、資本以及電腦計算力有著向越來越少數(shù)的公司集中的趨勢。人工智能行業(yè)是否會被壟斷?而那些人工智能領(lǐng)域的創(chuàng)業(yè)者成長的空間在哪里?
哈薩比斯說,這正是DeepMind公開研究成果的原因。這一領(lǐng)域的發(fā)展方向,一定是在一個更廣闊的范圍內(nèi)為全人類共享利益,“而不是僅僅局限于少數(shù)幾家巨頭公司。”