從AlphaGO到現(xiàn)在的Master，人工智能AI也不一定無敵

時(shí)間：2020-08-14 15:27:01

關(guān)鍵字： 2016年度回顧 alphago 人工智能

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀] 2016年3月9日可能會(huì)成為寫入人類史冊(cè)的一天——持續(xù)五天的谷歌AlphaGo大戰(zhàn)李世石開始，一場(chǎng)世界上最會(huì)下圍棋的人與人工智能的超級(jí)對(duì)弈，被全人類通過網(wǎng)絡(luò)直播共同圍觀。

2016年3月9日可能會(huì)成為寫入人類史冊(cè)的一天——持續(xù)五天的谷歌AlphaGo大戰(zhàn)李世石開始，一場(chǎng)世界上最會(huì)下圍棋的人與人工智能的超級(jí)對(duì)弈，被全人類通過網(wǎng)絡(luò)直播共同圍觀。

在賽前，圍棋界和科學(xué)界的很多人都對(duì)這場(chǎng)比賽做了預(yù)測(cè)。谷歌對(duì)自己開發(fā)的機(jī)器人信心很足，聲稱根據(jù)電腦計(jì)算的結(jié)果，李世石打敗“阿爾法狗”的概率為0。而圍棋界則多數(shù)站在李世石這一邊，中國棋圣聶衛(wèi)平認(rèn)為李世石敗北是不可能的事情。

就在這第一場(chǎng)比賽中，李世石在前期優(yōu)勢(shì)的情況下不敵“阿爾法狗”，并在終局宣告認(rèn)輸。而在賽前，李世石曾自信表示自己能夠贏滿5盤。所以說flag不要亂立。AlphaGO 到底是何方神圣？竟強(qiáng)到讓圍棋一代天驕李世石九段敗下陣來？

簡(jiǎn)單介紹一下，谷歌AlphaGo是什么？作為一種人工智能的AlphaGo，和IBM 在上個(gè)世紀(jì)打敗國際象棋大師卡斯帕羅夫的深藍(lán)超級(jí)計(jì)算機(jī)，以及當(dāng)代的蘋果Siri、Google Now有著顯著的區(qū)別。要解讀AlphaGo，首先我們需要了解AlphaGo背后到底是一個(gè)什么東西。其實(shí)谷歌AlphaGo背后是一套神經(jīng)網(wǎng)絡(luò)系統(tǒng)，由 Google 2014 年收購的英國人工智能公司 DeepMind 開發(fā)。這個(gè)系統(tǒng)和深藍(lán)不同，不是一臺(tái)超級(jí)計(jì)算機(jī)，而是一個(gè)由許多個(gè)數(shù)據(jù)中心作為節(jié)點(diǎn)相連，每個(gè)節(jié)點(diǎn)內(nèi)有著多臺(tái)超級(jí)計(jì)算機(jī)的神經(jīng)網(wǎng)絡(luò)系統(tǒng)。就像人腦，是由 50-100 億個(gè)神經(jīng)元所組成的，這也是為什么這種機(jī)器學(xué)習(xí)架構(gòu)被稱為神經(jīng)網(wǎng)絡(luò)。

AlphaGo 是在這個(gè)神經(jīng)網(wǎng)絡(luò)系統(tǒng)上，專為下圍棋（Go）而開發(fā)出的一個(gè)實(shí)例。然而，雖然名字已經(jīng)介紹了它的功能，AlphaGo 背后的神經(jīng)網(wǎng)絡(luò)系統(tǒng)卻適合用于任何智力競(jìng)技類項(xiàng)目。

其實(shí)“Master”的棋手就是AlphaGo的升級(jí)版

1月5日消息，谷歌DeepMind開發(fā)的AI在圍棋棋盤上戰(zhàn)勝韓國世界冠軍之后再度重返，2016年12月29日至2017年1月4日，谷歌AlphaGo的升級(jí)版本以Master為名，在弈城圍棋網(wǎng)和野狐圍棋網(wǎng)的快棋比賽中對(duì)人類最高水平的選手取得了60:0的壓倒戰(zhàn)績(jī)，再次讓人們對(duì)圍棋AI的實(shí)力感到震驚。5日早些時(shí)候，谷歌DeepMind創(chuàng)始人丹米斯·哈撒比斯（Demis Hassabis）在Twitter發(fā)布消息，證實(shí)升級(jí)版AlphaGo在網(wǎng)上與真人對(duì)決。

哈撒比斯寫道：“在過去幾天里，我們?cè)诰W(wǎng)上進(jìn)行了一些非正式圍棋比賽，對(duì)局以快棋的形式進(jìn)行……我們的目的只是為了查看系統(tǒng)是否如預(yù)期一樣好。”他還說：“感謝那些在弈城圍棋網(wǎng)和野狐圍棋網(wǎng)與我們對(duì)弈的棋手，我們的賬號(hào)是Magister（P）和Master（P），我們還要感謝那些觀戰(zhàn)的人。”

之前許多人都在猜測(cè)這位圍棋高手是誰，大家都不確定，有人懷疑它是電腦。中國棋手古力懸賞10萬元，尋找可以打敗“Master”的棋手。

DeepMind發(fā)布的消息顯示，非正式測(cè)試可能已經(jīng)結(jié)束，今年晚些時(shí)候，AlphaGo將會(huì)參加一些正式比賽。

一直以來，我們都在努力改進(jìn)AlphaGo，在過去幾天里，我們進(jìn)行了一些非正式網(wǎng)上比賽，對(duì)局以快棋的形式進(jìn)行，參加比賽的是最新開發(fā)的原型版系統(tǒng)，進(jìn)行網(wǎng)上對(duì)決只是為了檢查系統(tǒng)，看它是不是和預(yù)料的一樣好。感謝那些在弈城圍棋網(wǎng)和野狐圍棋網(wǎng)與我們對(duì)弈的棋手，我們的賬號(hào)是Magister（P）和Master（P），我們還要感謝那些觀戰(zhàn)的人。

新版AlphaGo在比賽中下出了一些富有創(chuàng)意、非常漂亮的棋步，我們和圍棋社區(qū)從中學(xué)到了許多東西，對(duì)此我們感到很興奮，結(jié)果讓人滿意。

人工智能大家談：AI在圍棋界已再無對(duì)手，但并不證明在其他領(lǐng)域也是這樣

與AlphaGo對(duì)弈之后，棋手古力發(fā)帖稱：“人類與AI攜手合作，很快將會(huì)揭開圍棋的深層秘密。”現(xiàn)在我們的非正式測(cè)試已經(jīng)結(jié)束，今年我們準(zhǔn)備與圍棋組織、專家合作，舉辦正式、完整的比賽，進(jìn)一步探索圍棋的秘密，讓人類與AI互相啟迪，共同進(jìn)步。很快我們就會(huì)公布更多消息。

Master目前一局未輸，是不是代表人工智能在圍棋界已再無對(duì)手？第四范式CEO戴文淵認(rèn)為基本已成定局。戴文淵稱，機(jī)器學(xué)習(xí)的能力太強(qiáng)了，它是勤奮好學(xué)的不知疲倦的小孩，沒有人能維持這樣的強(qiáng)度，所以人類和機(jī)器的差距會(huì)越來越大。現(xiàn)在想贏機(jī)器，需要頂尖高手戳中機(jī)器盲點(diǎn)這樣的黑天鵝事件才有可能。

對(duì)于Master是否是AlphaGo這個(gè)問題，戴文淵稱這個(gè)已經(jīng)不重要了。因?yàn)锳lphaGo本身的技術(shù)已沒有什么秘密可言，只要有足夠的計(jì)算資源，然后按照AlphaGo的方式去訓(xùn)練一個(gè)下圍棋的程序，最終都能實(shí)現(xiàn)這樣的高水平。戴文淵稱，技術(shù)其實(shí)不需要有特別大的突破，只需要按照原來的方式多訓(xùn)練一段時(shí)間，就會(huì)比原來的AlphaGo更強(qiáng)。不過，雖然從技術(shù)上來說其它公司實(shí)現(xiàn)Master是可能的，但從成本上考慮，應(yīng)該不可能是個(gè)小公司，因?yàn)橛?jì)算成本還是蠻高的。

對(duì)于Master在圍棋界大殺四方的舉動(dòng)，出門問問CEO李志飛稱，我不知道（Master）是不是AlphoGo，但堅(jiān)信所有的ArTIficial Games（人工游戲）最終機(jī)器都會(huì)大勝人類。AlphoGo是AI能力的很好demo，但是如果說AlphoGo贏了人類就代表AI智商超過人類完全是無稽之談，比如說AlphaGo還完全沒有涉及到很多人的智商里的組成如自然語言理解和對(duì)話。

是不是在別的領(lǐng)域訓(xùn)練出一個(gè)AlphaGo也在變得更容易？戴文淵認(rèn)為并不是這樣的，“下棋這個(gè)的場(chǎng)景有著天然的優(yōu)勢(shì)，即每天機(jī)器只需要和自己下棋就夠了，不需要外界很多的輸入。類似的場(chǎng)景還有游戲類競(jìng)技領(lǐng)域，機(jī)器也只需要自己和自己不斷比賽練習(xí)就可以；還有開車、開飛機(jī)等現(xiàn)實(shí)場(chǎng)景，雖然其中會(huì)涉及成本問題但也只需要自己積累數(shù)據(jù)就可完成訓(xùn)練。”戴文淵表示，在其他領(lǐng)域，比方說醫(yī)療領(lǐng)域，想訓(xùn)練出AlphaGo的目標(biāo)就很難實(shí)現(xiàn)，因?yàn)椴皇钦f機(jī)器想學(xué)習(xí)案例，就一定恰好有合適的足夠多的病例出現(xiàn)，這樣的場(chǎng)景需要外界給予足夠的輸入和配合。