對(duì)于AlphaGo IBM“深藍(lán)\"開發(fā)者是如何看待的呢?
本周谷歌DeepMind團(tuán)隊(duì)的戰(zhàn)功吸引了全世界的目光,央視甚至在兩會(huì)期間插播這場(chǎng)賽事。谷歌AlphaGo在與李世石5局3勝的圍棋比賽中,率先以3:0鎖定了戰(zhàn)績(jī),以至于輸給李的第四局,甚至有網(wǎng)友猜測(cè),這是AlphaGo故意放水,給人類留點(diǎn)面子。中國(guó)古代棋類游戲的微妙與復(fù)雜,不僅人類沉迷其中,越來越多的人工智能試圖用此來證明”你們?nèi)祟悓?shí)在太弱了“。
其實(shí),早在幾十年前,AI專家就預(yù)測(cè)到了這個(gè)結(jié)果,跟今天的AlphaGo一樣,20年前IBM帶著“深藍(lán)"擊敗了國(guó)際圍棋手卡斯帕羅夫。默里·坎貝爾(深藍(lán)研究科學(xué)家)是深藍(lán)發(fā)展的關(guān)鍵人物之一,直到現(xiàn)在,他依然作為IBM認(rèn)知計(jì)算部門的高級(jí)經(jīng)歷負(fù)責(zé)Watson AI平臺(tái)。
默里·坎貝爾在此前接受媒體采訪,當(dāng)年他是如何讓深藍(lán)贏的?以及現(xiàn)在的比賽與當(dāng)年又有什么不同呢?讓我們來看看以下精彩的問答:
深藍(lán)最著名的勝利發(fā)生在20年前,當(dāng)年你是怎樣讓深藍(lán)精通國(guó)際象棋并擊敗卡斯帕羅夫呢?
事實(shí)上,我們從卡內(nèi)基·梅隆大學(xué)畢業(yè)后就在從事國(guó)際象棋程序工作了,然后,谷歌聘請(qǐng)了我們3個(gè)同學(xué)來創(chuàng)建下一代國(guó)際象棋機(jī)器,也就是后來的“深藍(lán)”。當(dāng)時(shí),我們認(rèn)識(shí)到一個(gè)純蠻力的方法是很難擊敗世界冠軍的,但從另外一方面來說,當(dāng)我們擁有大量的計(jì)算能力,情況就變得不一樣了,這也證實(shí)了編程力量強(qiáng)弱直接決定了計(jì)算的快慢。于是,我們?cè)诔绦蛑屑尤肓艘恍┫冗M(jìn)的AI算法,在搜索和評(píng)估中,并且配備了大型超級(jí)計(jì)算機(jī)的機(jī)器,最終創(chuàng)造出了國(guó)際水平級(jí)別的國(guó)際象棋程序。事實(shí)上,我們?cè)?996年的比賽中失敗了,但第二年卷土重來,最終在1997年我們贏得了勝利。
站在人類的立場(chǎng)上,你進(jìn)入這一領(lǐng)域的動(dòng)機(jī)是什么呢?僅僅是個(gè)人對(duì)于國(guó)際象棋的興趣,或者說你更看重是計(jì)算機(jī)能力的挑戰(zhàn)呢?
好吧,我不得不說,這兩者都有,我確實(shí)對(duì)國(guó)際象棋非常感興趣,在我成為計(jì)算機(jī)科學(xué)家之前,我就是一名國(guó)際象棋手——我是故鄉(xiāng)加拿大阿爾伯塔省的國(guó)際象棋冠軍。但是我認(rèn)識(shí)到,我并沒有真正大師的那種水平。這就讓我非常感興趣了,如果有天我創(chuàng)造出一個(gè)具有超高水準(zhǔn)的計(jì)算機(jī)玩家呢。在我的學(xué)習(xí)過程中,一直保留著這個(gè)興趣,所以當(dāng)我加入了IBM我認(rèn)為是時(shí)候結(jié)束這個(gè)假如了,并證明給大家看它是真的可以實(shí)現(xiàn)。
但是又不同于個(gè)人興趣,在那個(gè)時(shí)期,它也作為一個(gè)對(duì)于計(jì)算機(jī)科學(xué)的挑戰(zhàn)。1949年克勞德·香農(nóng)發(fā)布了一個(gè)著名的論文—世界知名的數(shù)學(xué)家,他在論文說到了創(chuàng)建一個(gè)國(guó)際象棋的電腦會(huì)是什么樣的,并且預(yù)言,這將是一個(gè)巨大的挑戰(zhàn)。
這份工作對(duì)于你的棋藝需要高到什么程度呢?只是把規(guī)則寫進(jìn)去,然后讓計(jì)算機(jī)在這基礎(chǔ)規(guī)則上工作,還是要把你所有的下棋經(jīng)驗(yàn)也寫進(jìn)去呢?
我覺得下棋的一些知識(shí)是很重要的,當(dāng)然在早期的時(shí)候這些并不會(huì)顯現(xiàn)出來,但你要造出真正的“高手”這不可或缺,我們當(dāng)然不是所謂的高手。當(dāng)?shù)搅俗詈蟮臏?zhǔn)備階段就會(huì)有很多小細(xì)節(jié),比如這盤棋是如何下的以及評(píng)測(cè)它的水平,所以我們決定在這個(gè)特定的時(shí)期請(qǐng)來真正的大師喬爾·本杰明與我們協(xié)商。而且在最后,我們還請(qǐng)來了額外的大師作為培訓(xùn)教練,用以評(píng)估我們的系統(tǒng)水平。
最初的目標(biāo)只是為了模擬人類的玩法風(fēng)格,還是創(chuàng)造一個(gè)不惜一切代價(jià)只為贏得比賽的機(jī)器呢?
我認(rèn)為我們并沒有試圖去模仿人類的風(fēng)格,只是在某種程度上,人類玩得很好,所以我們想在這些地方發(fā)揮好。人類的下棋風(fēng)格是相當(dāng)不錯(cuò)的研究材料,但是它并不是完全清晰的,至少過去幾十年心理學(xué)家一直在研究。他們得出的結(jié)果是:高手們和大師僅僅只會(huì)看重一小部分棋招和位置,他們將考慮得非常清楚。有時(shí)候,他們不得不通過巨大的大腦計(jì)算量來決定下一步做什么,但有時(shí)候也不會(huì)這樣,但具體是哪一部分棋會(huì)讓他們深思呢,這是非常復(fù)雜的評(píng)估。所以,我們?nèi)ズ茈y效仿他們的風(fēng)格。
在早期的人工智能工作中我們確實(shí)嘗試去創(chuàng)建一個(gè)更加人性化風(fēng)格的計(jì)算機(jī),但它們很容易被“電腦”風(fēng)格打敗。你可以說,通過找到盡可能多的下法它們的水平也就非常低。但僅僅進(jìn)通過純粹全面的搜索下法確實(shí)可以達(dá)到一個(gè)不錯(cuò)的水準(zhǔn),到這個(gè)階段我們意識(shí)到僅僅依靠計(jì)算搜索還是不夠的,你必須可以真正上的模仿人類的玩法思路,或者說要讓機(jī)器學(xué)會(huì)思考。人類非常擅長(zhǎng)在關(guān)鍵線上深思,我們也需要讓我們的系統(tǒng)做到這點(diǎn),這對(duì)于”深藍(lán)“的成功來說非常重要。
在1997年,大部分看過卡斯帕羅夫輸?shù)舻钠寰值钠迨?,?huì)不會(huì)認(rèn)為深藍(lán)下棋的風(fēng)格是非常不一樣的?
是的,這種表達(dá)已經(jīng)使用了相當(dāng)長(zhǎng)的一段時(shí)間了。你看到電腦下的一步非常意外的或者直觀的棋,他們稱之為“電腦舉動(dòng)”。這只是人們的固步自封,而且他們自己和高手都不建議這樣下而已。這就是為什么電腦能打敗人類,即使在某種意義上,對(duì)它們的水平評(píng)測(cè)還比較低。他們之所以能擊敗人類是因?yàn)樗鼈冎荒芸吹较缕宓牟襟E,而人類總會(huì)縱觀整個(gè)棋局,這就是它們的不同之處。我可以說,目前年輕的一代棋手似乎能夠接受電腦棋局相比于老一輩來說,這非常有意思。我覺得他們?cè)谕娔X下棋的同時(shí),固步自封的地方逐漸抹去了。
所以,最后,計(jì)算機(jī)的優(yōu)越性是讓人類更好。
我認(rèn)為這是絕對(duì)正確的,是的。
“僅僅只通過觀棋,要找到下一步棋是非常困難的。”
就計(jì)算機(jī)科學(xué)方面的需求而言,圍棋與國(guó)際象棋之間有什么區(qū)別?
我并沒有玩過圍棋,在我的生活中玩的游戲并不多,但我確實(shí)知道很多關(guān)于圍棋的規(guī)則。這兩款游戲玩法都是非常巨大的,一旦你下到了第10到100步之間,你可能無法算出第120步、170步會(huì)怎么走,那需要非常巨大的計(jì)算,非常復(fù)雜的游戲。此外,圍棋還有一個(gè)國(guó)際象棋沒有的特點(diǎn),就是你無法直接看到一下步棋怎么走,你需要思考與布局。
但圍棋是一種游戲,隨著時(shí)間的推移,你的布局威力才會(huì)慢慢顯現(xiàn)出來。而國(guó)際象棋則更多的是注重當(dāng)前的每一步棋。國(guó)際象棋沒有那么多框架布局,你可以通過計(jì)算棋局上誰(shuí)擁有的棋子多那么他的勝算也就更高了。很明顯圍棋比國(guó)際象棋對(duì)于思考的需求更高一些。
你覺得AlphaGo如何?這些技術(shù)在當(dāng)下是否可用,它們可否同樣適用于”深藍(lán)“呢?
這是一個(gè)非常,非常好的問題,我已經(jīng)跟谷歌DeepMind團(tuán)隊(duì)談?wù)撨^了。首先我覺得印象非常深刻,他們已經(jīng)明確提出了技術(shù)狀態(tài),如果他們能證明一下基礎(chǔ)機(jī)理并且不僅僅只有圍棋也適用于其他許多游戲,那我印象會(huì)更加深刻。但它們還是僅僅處在表面上,還沒有深思以后的出路,從這點(diǎn)來看,他們的進(jìn)步還可以吧。
現(xiàn)在問題是,AlphaGo是否也適用于國(guó)際象棋呢。我猜測(cè)它也許可以創(chuàng)造出一種程序,優(yōu)于所有人類棋手,但我并不認(rèn)為它是最先進(jìn)的。我認(rèn)為,目前的國(guó)際象棋程序已經(jīng)是令人難以置信的強(qiáng)大和非常超人,而且我不認(rèn)為谷歌的方法可以創(chuàng)造出一個(gè)最先進(jìn)的國(guó)際象棋程序,比現(xiàn)在所有方案還要好。
我之所以這么說是因?yàn)閲?guó)際象棋與圍棋的性質(zhì)不同,上面我們也說到了,國(guó)際象棋更注重搜索,而圍棋則傾向于布局與結(jié)構(gòu)。當(dāng)然,圍棋有時(shí)候也需要非常深入的搜索。但總的來說,圍棋更是一個(gè)關(guān)于直觀與功能的評(píng)估,看棋子之前如何互相影響。
所以,在搜索和現(xiàn)代程序中真的沒有替代。——我所知道的最好的程序叫Komodo—它是個(gè)非常高效的搜索程序,通過許多不可能的搜索步驟,還有深入的搜索。我認(rèn)為把已經(jīng)用在AlphaGo上的程序應(yīng)用到國(guó)際象棋游戲中將會(huì)很困難,我不覺得AlphaGo可以適應(yīng)象棋的搜索,它們需要不同的突破。
不冒任何風(fēng)險(xiǎn)的說,你是否有預(yù)測(cè)這場(chǎng)比賽?
從一個(gè)數(shù)據(jù)點(diǎn)我很難告訴你。他們確實(shí)擊敗了歐洲冠軍樊輝,但它們也在休閑游戲中敗給他。假如現(xiàn)在他們更強(qiáng)了,李世石顯然也至少比歐洲冠軍要更厲害...如果我必須要說的話,我想說,電腦會(huì)贏得勝利,但它將被關(guān)閉。
如果AlphaGo贏了,一般來說對(duì)于整個(gè)人工智能領(lǐng)域會(huì)有什么意義呢——還有下一個(gè)目標(biāo)或者說里程碑嗎?
我認(rèn)為,從我的角度來看,建議對(duì)國(guó)際象棋和圍棋等游戲的研究放松下來。我覺得以后將會(huì)有更好的處理這類比賽的機(jī)制。部分原因是雖然它們?cè)谀撤N意義上來說是非常復(fù)雜的,但用另一種方式上又非常簡(jiǎn)單—它們是完美的信息游戲,它們是從無到有的游戲,它們是輪換游戲,所以它們也就不存在什么機(jī)會(huì)元素。而這也并不能反映在現(xiàn)實(shí)世界中的問題。在你的現(xiàn)實(shí)生活中,問題并不會(huì)就擺在你面前,它們總是無法預(yù)測(cè),當(dāng)你采取行動(dòng)或者作出決定后,后果才會(huì)非常清楚。
"人工智能應(yīng)用到現(xiàn)實(shí)生活的問題中將是下一個(gè)里程碑"
所以我認(rèn)為,把AlphaGo系統(tǒng)應(yīng)用到其他游戲中去將會(huì)是非常有趣的事,而且讓AlphaGo 完全脫離人類的輔助也將會(huì)是非常有意思的事。——現(xiàn)在他們的系統(tǒng)還添加了很多人類經(jīng)驗(yàn)以及人類的下棋套路。這個(gè)證明將會(huì)是一個(gè)非常有趣的里程碑,但我的感覺是,我們正超越棋盤游戲。還有其它的游戲,比如有趣的、隱藏了信息的、隨機(jī)的,它們?nèi)耘f非常有趣,忍不住想征服,但現(xiàn)實(shí)世界中依然存在很多問題,如果我們可以把人工智能應(yīng)用起來這將會(huì)帶來巨大的價(jià)值,現(xiàn)在這些技術(shù)正在被開發(fā)中——例如IBM的Watson,我認(rèn)為將人工智能應(yīng)用到現(xiàn)實(shí)生活問題中這將是人工智能的下一個(gè)里程碑。
還有一件事,繼續(xù)思考后我想要強(qiáng)調(diào):隨著人工智能進(jìn)入我們現(xiàn)實(shí)生活應(yīng)用中,我并不認(rèn)為,人工智能系統(tǒng)將如超人般迅速是合理的。我認(rèn)為他們會(huì)對(duì)某一些事情的表現(xiàn)非常好,但是另外的事情就非常差勁了。我有一種感覺,人類與人工智能將會(huì)有一個(gè)互補(bǔ)性存在,人類擅長(zhǎng)的事情機(jī)器就很差,反之亦然,所以兩者合作就能夠優(yōu)勢(shì)互補(bǔ)。
什么是人工智能最直接的現(xiàn)實(shí)世界應(yīng)用?你覺得什么最突出?
我認(rèn)為最有意思的應(yīng)用應(yīng)該是在醫(yī)療保健領(lǐng)域。這個(gè)領(lǐng)域我其實(shí)并不希望電腦進(jìn)入,或者說讓它們來做決策,但是我覺得它們會(huì)通過分析數(shù)據(jù)使人類的決策者更好。——通過復(fù)雜的算法去運(yùn)行數(shù)據(jù)模型,并提供深入分析報(bào)告反饋給人類決策者比如醫(yī)生和放射科醫(yī)生們,使他們做的決定更為高效,也更加準(zhǔn)確。我認(rèn)為在不同的檢測(cè)中機(jī)器人的指尖將會(huì)挖掘出更多的信息,然后給出更多的建議,這是相當(dāng)有用的。所以我覺得它會(huì)讓人類的決策者更好。