對于AlphaGo IBM“深藍\"開發(fā)者是如何看待的呢？

時間：2016-03-15 19:08:33

關(guān)鍵字： alphago IBM 人工智能真心話深藍

手機看文章

掃描二維碼
隨時隨地手機看文章

[導(dǎo)讀]本周谷歌DeepMind團隊的戰(zhàn)功吸引了全世界的目光，央視甚至在兩會期間插播這場賽事。谷歌AlphaGo在與李世石5局3勝的圍棋比賽中，率先以3:0鎖定了戰(zhàn)績，以至于輸給李的第四局，甚至有網(wǎng)友猜測，這是AlphaGo故意放水，給

本周谷歌DeepMind團隊的戰(zhàn)功吸引了全世界的目光，央視甚至在兩會期間插播這場賽事。谷歌AlphaGo在與李世石5局3勝的圍棋比賽中，率先以3:0鎖定了戰(zhàn)績，以至于輸給李的第四局，甚至有網(wǎng)友猜測，這是AlphaGo故意放水，給人類留點面子。中國古代棋類游戲的微妙與復(fù)雜，不僅人類沉迷其中，越來越多的人工智能試圖用此來證明”你們?nèi)祟悓嵲谔趿?ldquo;。

其實，早在幾十年前，AI專家就預(yù)測到了這個結(jié)果，跟今天的AlphaGo一樣，20年前IBM帶著“深藍"擊敗了國際圍棋手卡斯帕羅夫。默里·坎貝爾(深藍研究科學(xué)家)是深藍發(fā)展的關(guān)鍵人物之一，直到現(xiàn)在，他依然作為IBM認知計算部門的高級經(jīng)歷負責(zé)Watson AI平臺。

默里·坎貝爾在此前接受媒體采訪，當(dāng)年他是如何讓深藍贏的?以及現(xiàn)在的比賽與當(dāng)年又有什么不同呢?讓我們來看看以下精彩的問答：

深藍最著名的勝利發(fā)生在20年前，當(dāng)年你是怎樣讓深藍精通國際象棋并擊敗卡斯帕羅夫呢?

事實上，我們從卡內(nèi)基·梅隆大學(xué)畢業(yè)后就在從事國際象棋程序工作了，然后，谷歌聘請了我們3個同學(xué)來創(chuàng)建下一代國際象棋機器，也就是后來的“深藍”。當(dāng)時，我們認識到一個純蠻力的方法是很難擊敗世界冠軍的，但從另外一方面來說，當(dāng)我們擁有大量的計算能力，情況就變得不一樣了，這也證實了編程力量強弱直接決定了計算的快慢。于是，我們在程序中加入了一些先進的AI算法，在搜索和評估中，并且配備了大型超級計算機的機器，最終創(chuàng)造出了國際水平級別的國際象棋程序。事實上，我們在1996年的比賽中失敗了，但第二年卷土重來，最終在1997年我們贏得了勝利。

站在人類的立場上，你進入這一領(lǐng)域的動機是什么呢?僅僅是個人對于國際象棋的興趣，或者說你更看重是計算機能力的挑戰(zhàn)呢?

好吧，我不得不說，這兩者都有，我確實對國際象棋非常感興趣，在我成為計算機科學(xué)家之前，我就是一名國際象棋手——我是故鄉(xiāng)加拿大阿爾伯塔省的國際象棋冠軍。但是我認識到，我并沒有真正大師的那種水平。這就讓我非常感興趣了，如果有天我創(chuàng)造出一個具有超高水準的計算機玩家呢。在我的學(xué)習(xí)過程中，一直保留著這個興趣，所以當(dāng)我加入了IBM我認為是時候結(jié)束這個假如了，并證明給大家看它是真的可以實現(xiàn)。

但是又不同于個人興趣，在那個時期，它也作為一個對于計算機科學(xué)的挑戰(zhàn)。1949年克勞德·香農(nóng)發(fā)布了一個著名的論文—世界知名的數(shù)學(xué)家，他在論文說到了創(chuàng)建一個國際象棋的電腦會是什么樣的，并且預(yù)言，這將是一個巨大的挑戰(zhàn)。

這份工作對于你的棋藝需要高到什么程度呢?只是把規(guī)則寫進去，然后讓計算機在這基礎(chǔ)規(guī)則上工作，還是要把你所有的下棋經(jīng)驗也寫進去呢?

我覺得下棋的一些知識是很重要的，當(dāng)然在早期的時候這些并不會顯現(xiàn)出來，但你要造出真正的“高手”這不可或缺，我們當(dāng)然不是所謂的高手。當(dāng)?shù)搅俗詈蟮臏蕚潆A段就會有很多小細節(jié)，比如這盤棋是如何下的以及評測它的水平，所以我們決定在這個特定的時期請來真正的大師喬爾·本杰明與我們協(xié)商。而且在最后，我們還請來了額外的大師作為培訓(xùn)教練，用以評估我們的系統(tǒng)水平。

最初的目標只是為了模擬人類的玩法風(fēng)格，還是創(chuàng)造一個不惜一切代價只為贏得比賽的機器呢?

我認為我們并沒有試圖去模仿人類的風(fēng)格，只是在某種程度上，人類玩得很好，所以我們想在這些地方發(fā)揮好。人類的下棋風(fēng)格是相當(dāng)不錯的研究材料，但是它并不是完全清晰的，至少過去幾十年心理學(xué)家一直在研究。他們得出的結(jié)果是：高手們和大師僅僅只會看重一小部分棋招和位置，他們將考慮得非常清楚。有時候，他們不得不通過巨大的大腦計算量來決定下一步做什么，但有時候也不會這樣，但具體是哪一部分棋會讓他們深思呢，這是非常復(fù)雜的評估。所以，我們?nèi)ズ茈y效仿他們的風(fēng)格。

在早期的人工智能工作中我們確實嘗試去創(chuàng)建一個更加人性化風(fēng)格的計算機，但它們很容易被“電腦”風(fēng)格打敗。你可以說，通過找到盡可能多的下法它們的水平也就非常低。但僅僅進通過純粹全面的搜索下法確實可以達到一個不錯的水準，到這個階段我們意識到僅僅依靠計算搜索還是不夠的，你必須可以真正上的模仿人類的玩法思路，或者說要讓機器學(xué)會思考。人類非常擅長在關(guān)鍵線上深思，我們也需要讓我們的系統(tǒng)做到這點，這對于”深藍“的成功來說非常重要。

在1997年，大部分看過卡斯帕羅夫輸?shù)舻钠寰值钠迨郑瑫粫J為深藍下棋的風(fēng)格是非常不一樣的?

是的，這種表達已經(jīng)使用了相當(dāng)長的一段時間了。你看到電腦下的一步非常意外的或者直觀的棋，他們稱之為“電腦舉動”。這只是人們的固步自封，而且他們自己和高手都不建議這樣下而已。這就是為什么電腦能打敗人類，即使在某種意義上，對它們的水平評測還比較低。他們之所以能擊敗人類是因為它們只能看到下棋的步驟，而人類總會縱觀整個棋局，這就是它們的不同之處。我可以說，目前年輕的一代棋手似乎能夠接受電腦棋局相比于老一輩來說，這非常有意思。我覺得他們在同電腦下棋的同時，固步自封的地方逐漸抹去了。

所以，最后，計算機的優(yōu)越性是讓人類更好。

我認為這是絕對正確的，是的。

“僅僅只通過觀棋，要找到下一步棋是非常困難的。”

就計算機科學(xué)方面的需求而言，圍棋與國際象棋之間有什么區(qū)別?

我并沒有玩過圍棋，在我的生活中玩的游戲并不多，但我確實知道很多關(guān)于圍棋的規(guī)則。這兩款游戲玩法都是非常巨大的，一旦你下到了第10到100步之間，你可能無法算出第120步、170步會怎么走，那需要非常巨大的計算，非常復(fù)雜的游戲。此外，圍棋還有一個國際象棋沒有的特點，就是你無法直接看到一下步棋怎么走，你需要思考與布局。

但圍棋是一種游戲，隨著時間的推移，你的布局威力才會慢慢顯現(xiàn)出來。而國際象棋則更多的是注重當(dāng)前的每一步棋。國際象棋沒有那么多框架布局，你可以通過計算棋局上誰擁有的棋子多那么他的勝算也就更高了。很明顯圍棋比國際象棋對于思考的需求更高一些。

你覺得AlphaGo如何?這些技術(shù)在當(dāng)下是否可用，它們可否同樣適用于”深藍“呢?

這是一個非常，非常好的問題，我已經(jīng)跟谷歌DeepMind團隊談?wù)撨^了。首先我覺得印象非常深刻，他們已經(jīng)明確提出了技術(shù)狀態(tài)，如果他們能證明一下基礎(chǔ)機理并且不僅僅只有圍棋也適用于其他許多游戲，那我印象會更加深刻。但它們還是僅僅處在表面上，還沒有深思以后的出路，從這點來看，他們的進步還可以吧。

現(xiàn)在問題是，AlphaGo是否也適用于國際象棋呢。我猜測它也許可以創(chuàng)造出一種程序，優(yōu)于所有人類棋手，但我并不認為它是最先進的。我認為，目前的國際象棋程序已經(jīng)是令人難以置信的強大和非常超人，而且我不認為谷歌的方法可以創(chuàng)造出一個最先進的國際象棋程序，比現(xiàn)在所有方案還要好。

我之所以這么說是因為國際象棋與圍棋的性質(zhì)不同，上面我們也說到了，國際象棋更注重搜索，而圍棋則傾向于布局與結(jié)構(gòu)。當(dāng)然，圍棋有時候也需要非常深入的搜索。但總的來說，圍棋更是一個關(guān)于直觀與功能的評估，看棋子之前如何互相影響。

所以，在搜索和現(xiàn)代程序中真的沒有替代。——我所知道的最好的程序叫Komodo—它是個非常高效的搜索程序，通過許多不可能的搜索步驟，還有深入的搜索。我認為把已經(jīng)用在AlphaGo上的程序應(yīng)用到國際象棋游戲中將會很困難，我不覺得AlphaGo可以適應(yīng)象棋的搜索，它們需要不同的突破。

不冒任何風(fēng)險的說，你是否有預(yù)測這場比賽?

從一個數(shù)據(jù)點我很難告訴你。他們確實擊敗了歐洲冠軍樊輝，但它們也在休閑游戲中敗給他。假如現(xiàn)在他們更強了，李世石顯然也至少比歐洲冠軍要更厲害...如果我必須要說的話，我想說，電腦會贏得勝利，但它將被關(guān)閉。

如果AlphaGo贏了，一般來說對于整個人工智能領(lǐng)域會有什么意義呢——還有下一個目標或者說里程碑嗎?

我認為，從我的角度來看，建議對國際象棋和圍棋等游戲的研究放松下來。我覺得以后將會有更好的處理這類比賽的機制。部分原因是雖然它們在某種意義上來說是非常復(fù)雜的，但用另一種方式上又非常簡單—它們是完美的信息游戲，它們是從無到有的游戲，它們是輪換游戲，所以它們也就不存在什么機會元素。而這也并不能反映在現(xiàn)實世界中的問題。在你的現(xiàn)實生活中，問題并不會就擺在你面前，它們總是無法預(yù)測，當(dāng)你采取行動或者作出決定后，后果才會非常清楚。

"人工智能應(yīng)用到現(xiàn)實生活的問題中將是下一個里程碑"

所以我認為，把AlphaGo系統(tǒng)應(yīng)用到其他游戲中去將會是非常有趣的事，而且讓AlphaGo 完全脫離人類的輔助也將會是非常有意思的事。——現(xiàn)在他們的系統(tǒng)還添加了很多人類經(jīng)驗以及人類的下棋套路。這個證明將會是一個非常有趣的里程碑，但我的感覺是，我們正超越棋盤游戲。還有其它的游戲，比如有趣的、隱藏了信息的、隨機的，它們?nèi)耘f非常有趣，忍不住想征服，但現(xiàn)實世界中依然存在很多問題，如果我們可以把人工智能應(yīng)用起來這將會帶來巨大的價值，現(xiàn)在這些技術(shù)正在被開發(fā)中——例如IBM的Watson，我認為將人工智能應(yīng)用到現(xiàn)實生活問題中這將是人工智能的下一個里程碑。

還有一件事，繼續(xù)思考后我想要強調(diào)：隨著人工智能進入我們現(xiàn)實生活應(yīng)用中，我并不認為，人工智能系統(tǒng)將如超人般迅速是合理的。我認為他們會對某一些事情的表現(xiàn)非常好，但是另外的事情就非常差勁了。我有一種感覺，人類與人工智能將會有一個互補性存在，人類擅長的事情機器就很差，反之亦然，所以兩者合作就能夠優(yōu)勢互補。

什么是人工智能最直接的現(xiàn)實世界應(yīng)用?你覺得什么最突出?

我認為最有意思的應(yīng)用應(yīng)該是在醫(yī)療保健領(lǐng)域。這個領(lǐng)域我其實并不希望電腦進入，或者說讓它們來做決策，但是我覺得它們會通過分析數(shù)據(jù)使人類的決策者更好。——通過復(fù)雜的算法去運行數(shù)據(jù)模型，并提供深入分析報告反饋給人類決策者比如醫(yī)生和放射科醫(yī)生們，使他們做的決定更為高效，也更加準確。我認為在不同的檢測中機器人的指尖將會挖掘出更多的信息，然后給出更多的建議，這是相當(dāng)有用的。所以我覺得它會讓人類的決策者更好。