對于AlphaGo IBM“深藍\"開發(fā)者是如何看待的呢?
本周谷歌DeepMind團隊的戰(zhàn)功吸引了全世界的目光,央視甚至在兩會期間插播這場賽事。谷歌AlphaGo在與李世石5局3勝的圍棋比賽中,率先以3:0鎖定了戰(zhàn)績,以至于輸給李的第四局,甚至有網(wǎng)友猜測,這是AlphaGo故意放水,給人類留點面子。中國古代棋類游戲的微妙與復(fù)雜,不僅人類沉迷其中,越來越多的人工智能試圖用此來證明”你們?nèi)祟悓嵲谔趿?ldquo;。
其實,早在幾十年前,AI專家就預(yù)測到了這個結(jié)果,跟今天的AlphaGo一樣,20年前IBM帶著“深藍"擊敗了國際圍棋手卡斯帕羅夫。默里·坎貝爾(深藍研究科學(xué)家)是深藍發(fā)展的關(guān)鍵人物之一,直到現(xiàn)在,他依然作為IBM認知計算部門的高級經(jīng)歷負責(zé)Watson AI平臺。
默里·坎貝爾在此前接受媒體采訪,當(dāng)年他是如何讓深藍贏的?以及現(xiàn)在的比賽與當(dāng)年又有什么不同呢?讓我們來看看以下精彩的問答:
深藍最著名的勝利發(fā)生在20年前,當(dāng)年你是怎樣讓深藍精通國際象棋并擊敗卡斯帕羅夫呢?
事實上,我們從卡內(nèi)基·梅隆大學(xué)畢業(yè)后就在從事國際象棋程序工作了,然后,谷歌聘請了我們3個同學(xué)來創(chuàng)建下一代國際象棋機器,也就是后來的“深藍”。當(dāng)時,我們認識到一個純蠻力的方法是很難擊敗世界冠軍的,但從另外一方面來說,當(dāng)我們擁有大量的計算能力,情況就變得不一樣了,這也證實了編程力量強弱直接決定了計算的快慢。于是,我們在程序中加入了一些先進的AI算法,在搜索和評估中,并且配備了大型超級計算機的機器,最終創(chuàng)造出了國際水平級別的國際象棋程序。事實上,我們在1996年的比賽中失敗了,但第二年卷土重來,最終在1997年我們贏得了勝利。
站在人類的立場上,你進入這一領(lǐng)域的動機是什么呢?僅僅是個人對于國際象棋的興趣,或者說你更看重是計算機能力的挑戰(zhàn)呢?
好吧,我不得不說,這兩者都有,我確實對國際象棋非常感興趣,在我成為計算機科學(xué)家之前,我就是一名國際象棋手——我是故鄉(xiāng)加拿大阿爾伯塔省的國際象棋冠軍。但是我認識到,我并沒有真正大師的那種水平。這就讓我非常感興趣了,如果有天我創(chuàng)造出一個具有超高水準的計算機玩家呢。在我的學(xué)習(xí)過程中,一直保留著這個興趣,所以當(dāng)我加入了IBM我認為是時候結(jié)束這個假如了,并證明給大家看它是真的可以實現(xiàn)。
但是又不同于個人興趣,在那個時期,它也作為一個對于計算機科學(xué)的挑戰(zhàn)。1949年克勞德·香農(nóng)發(fā)布了一個著名的論文—世界知名的數(shù)學(xué)家,他在論文說到了創(chuàng)建一個國際象棋的電腦會是什么樣的,并且預(yù)言,這將是一個巨大的挑戰(zhàn)。
這份工作對于你的棋藝需要高到什么程度呢?只是把規(guī)則寫進去,然后讓計算機在這基礎(chǔ)規(guī)則上工作,還是要把你所有的下棋經(jīng)驗也寫進去呢?
我覺得下棋的一些知識是很重要的,當(dāng)然在早期的時候這些并不會顯現(xiàn)出來,但你要造出真正的“高手”這不可或缺,我們當(dāng)然不是所謂的高手。當(dāng)?shù)搅俗詈蟮臏蕚潆A段就會有很多小細節(jié),比如這盤棋是如何下的以及評測它的水平,所以我們決定在這個特定的時期請來真正的大師喬爾·本杰明與我們協(xié)商。而且在最后,我們還請來了額外的大師作為培訓(xùn)教練,用以評估我們的系統(tǒng)水平。
最初的目標只是為了模擬人類的玩法風(fēng)格,還是創(chuàng)造一個不惜一切代價只為贏得比賽的機器呢?
我認為我們并沒有試圖去模仿人類的風(fēng)格,只是在某種程度上,人類玩得很好,所以我們想在這些地方發(fā)揮好。人類的下棋風(fēng)格是相當(dāng)不錯的研究材料,但是它并不是完全清晰的,至少過去幾十年心理學(xué)家一直在研究。他們得出的結(jié)果是:高手們和大師僅僅只會看重一小部分棋招和位置,他們將考慮得非常清楚。有時候,他們不得不通過巨大的大腦計算量來決定下一步做什么,但有時候也不會這樣,但具體是哪一部分棋會讓他們深思呢,這是非常復(fù)雜的評估。所以,我們?nèi)ズ茈y效仿他們的風(fēng)格。
在早期的人工智能工作中我們確實嘗試去創(chuàng)建一個更加人性化風(fēng)格的計算機,但它們很容易被“電腦”風(fēng)格打敗。你可以說,通過找到盡可能多的下法它們的水平也就非常低。但僅僅進通過純粹全面的搜索下法確實可以達到一個不錯的水準,到這個階段我們意識到僅僅依靠計算搜索還是不夠的,你必須可以真正上的模仿人類的玩法思路,或者說要讓機器學(xué)會思考。人類非常擅長在關(guān)鍵線上深思,我們也需要讓我們的系統(tǒng)做到這點,這對于”深藍“的成功來說非常重要。
在1997年,大部分看過卡斯帕羅夫輸?shù)舻钠寰值钠迨郑瑫粫J為深藍下棋的風(fēng)格是非常不一樣的?
是的,這種表達已經(jīng)使用了相當(dāng)長的一段時間了。你看到電腦下的一步非常意外的或者直觀的棋,他們稱之為“電腦舉動”。這只是人們的固步自封,而且他們自己和高手都不建議這樣下而已。這就是為什么電腦能打敗人類,即使在某種意義上,對它們的水平評測還比較低。他們之所以能擊敗人類是因為它們只能看到下棋的步驟,而人類總會縱觀整個棋局,這就是它們的不同之處。我可以說,目前年輕的一代棋手似乎能夠接受電腦棋局相比于老一輩來說,這非常有意思。我覺得他們在同電腦下棋的同時,固步自封的地方逐漸抹去了。
所以,最后,計算機的優(yōu)越性是讓人類更好。
我認為這是絕對正確的,是的。
“僅僅只通過觀棋,要找到下一步棋是非常困難的。”
就計算機科學(xué)方面的需求而言,圍棋與國際象棋之間有什么區(qū)別?
我并沒有玩過圍棋,在我的生活中玩的游戲并不多,但我確實知道很多關(guān)于圍棋的規(guī)則。這兩款游戲玩法都是非常巨大的,一旦你下到了第10到100步之間,你可能無法算出第120步、170步會怎么走,那需要非常巨大的計算,非常復(fù)雜的游戲。此外,圍棋還有一個國際象棋沒有的特點,就是你無法直接看到一下步棋怎么走,你需要思考與布局。
但圍棋是一種游戲,隨著時間的推移,你的布局威力才會慢慢顯現(xiàn)出來。而國際象棋則更多的是注重當(dāng)前的每一步棋。國際象棋沒有那么多框架布局,你可以通過計算棋局上誰擁有的棋子多那么他的勝算也就更高了。很明顯圍棋比國際象棋對于思考的需求更高一些。
你覺得AlphaGo如何?這些技術(shù)在當(dāng)下是否可用,它們可否同樣適用于”深藍“呢?
這是一個非常,非常好的問題,我已經(jīng)跟谷歌DeepMind團隊談?wù)撨^了。首先我覺得印象非常深刻,他們已經(jīng)明確提出了技術(shù)狀態(tài),如果他們能證明一下基礎(chǔ)機理并且不僅僅只有圍棋也適用于其他許多游戲,那我印象會更加深刻。但它們還是僅僅處在表面上,還沒有深思以后的出路,從這點來看,他們的進步還可以吧。
現(xiàn)在問題是,AlphaGo是否也適用于國際象棋呢。我猜測它也許可以創(chuàng)造出一種程序,優(yōu)于所有人類棋手,但我并不認為它是最先進的。我認為,目前的國際象棋程序已經(jīng)是令人難以置信的強大和非常超人,而且我不認為谷歌的方法可以創(chuàng)造出一個最先進的國際象棋程序,比現(xiàn)在所有方案還要好。
我之所以這么說是因為國際象棋與圍棋的性質(zhì)不同,上面我們也說到了,國際象棋更注重搜索,而圍棋則傾向于布局與結(jié)構(gòu)。當(dāng)然,圍棋有時候也需要非常深入的搜索。但總的來說,圍棋更是一個關(guān)于直觀與功能的評估,看棋子之前如何互相影響。
所以,在搜索和現(xiàn)代程序中真的沒有替代。——我所知道的最好的程序叫Komodo—它是個非常高效的搜索程序,通過許多不可能的搜索步驟,還有深入的搜索。我認為把已經(jīng)用在AlphaGo上的程序應(yīng)用到國際象棋游戲中將會很困難,我不覺得AlphaGo可以適應(yīng)象棋的搜索,它們需要不同的突破。
不冒任何風(fēng)險的說,你是否有預(yù)測這場比賽?
從一個數(shù)據(jù)點我很難告訴你。他們確實擊敗了歐洲冠軍樊輝,但它們也在休閑游戲中敗給他。假如現(xiàn)在他們更強了,李世石顯然也至少比歐洲冠軍要更厲害...如果我必須要說的話,我想說,電腦會贏得勝利,但它將被關(guān)閉。
如果AlphaGo贏了,一般來說對于整個人工智能領(lǐng)域會有什么意義呢——還有下一個目標或者說里程碑嗎?
我認為,從我的角度來看,建議對國際象棋和圍棋等游戲的研究放松下來。我覺得以后將會有更好的處理這類比賽的機制。部分原因是雖然它們在某種意義上來說是非常復(fù)雜的,但用另一種方式上又非常簡單—它們是完美的信息游戲,它們是從無到有的游戲,它們是輪換游戲,所以它們也就不存在什么機會元素。而這也并不能反映在現(xiàn)實世界中的問題。在你的現(xiàn)實生活中,問題并不會就擺在你面前,它們總是無法預(yù)測,當(dāng)你采取行動或者作出決定后,后果才會非常清楚。
"人工智能應(yīng)用到現(xiàn)實生活的問題中將是下一個里程碑"
所以我認為,把AlphaGo系統(tǒng)應(yīng)用到其他游戲中去將會是非常有趣的事,而且讓AlphaGo 完全脫離人類的輔助也將會是非常有意思的事。——現(xiàn)在他們的系統(tǒng)還添加了很多人類經(jīng)驗以及人類的下棋套路。這個證明將會是一個非常有趣的里程碑,但我的感覺是,我們正超越棋盤游戲。還有其它的游戲,比如有趣的、隱藏了信息的、隨機的,它們?nèi)耘f非常有趣,忍不住想征服,但現(xiàn)實世界中依然存在很多問題,如果我們可以把人工智能應(yīng)用起來這將會帶來巨大的價值,現(xiàn)在這些技術(shù)正在被開發(fā)中——例如IBM的Watson,我認為將人工智能應(yīng)用到現(xiàn)實生活問題中這將是人工智能的下一個里程碑。
還有一件事,繼續(xù)思考后我想要強調(diào):隨著人工智能進入我們現(xiàn)實生活應(yīng)用中,我并不認為,人工智能系統(tǒng)將如超人般迅速是合理的。我認為他們會對某一些事情的表現(xiàn)非常好,但是另外的事情就非常差勁了。我有一種感覺,人類與人工智能將會有一個互補性存在,人類擅長的事情機器就很差,反之亦然,所以兩者合作就能夠優(yōu)勢互補。
什么是人工智能最直接的現(xiàn)實世界應(yīng)用?你覺得什么最突出?
我認為最有意思的應(yīng)用應(yīng)該是在醫(yī)療保健領(lǐng)域。這個領(lǐng)域我其實并不希望電腦進入,或者說讓它們來做決策,但是我覺得它們會通過分析數(shù)據(jù)使人類的決策者更好。——通過復(fù)雜的算法去運行數(shù)據(jù)模型,并提供深入分析報告反饋給人類決策者比如醫(yī)生和放射科醫(yī)生們,使他們做的決定更為高效,也更加準確。我認為在不同的檢測中機器人的指尖將會挖掘出更多的信息,然后給出更多的建議,這是相當(dāng)有用的。所以我覺得它會讓人類的決策者更好。