從AlphaGO到現(xiàn)在的Master,人工智能AI也不一定無敵
2016年3月9日可能會(huì)成為寫入人類史冊(cè)的一天——持續(xù)五天的谷歌AlphaGo大戰(zhàn)李世石開始,一場(chǎng)世界上最會(huì)下圍棋的人與人工智能的超級(jí)對(duì)弈,被全人類通過網(wǎng)絡(luò)直播共同圍觀。
在賽前,圍棋界和科學(xué)界的很多人都對(duì)這場(chǎng)比賽做了預(yù)測(cè)。谷歌對(duì)自己開發(fā)的機(jī)器人信心很足,聲稱根據(jù)電腦計(jì)算的結(jié)果,李世石打敗“阿爾法狗”的概率為0。而圍棋界則多數(shù)站在李世石這一邊,中國棋圣聶衛(wèi)平認(rèn)為李世石敗北是不可能的事情。
就在這第一場(chǎng)比賽中,李世石在前期優(yōu)勢(shì)的情況下不敵“阿爾法狗”,并在終局宣告認(rèn)輸。而在賽前,李世石曾自信表示自己能夠贏滿5盤。所以說flag不要亂立。AlphaGO 到底是何方神圣?竟強(qiáng)到讓圍棋一代天驕李世石九段敗下陣來?
簡(jiǎn)單介紹一下,谷歌AlphaGo是什么?作為一種人工智能的AlphaGo,和IBM 在上個(gè)世紀(jì)打敗國際象棋大師卡斯帕羅夫的深藍(lán)超級(jí)計(jì)算機(jī),以及當(dāng)代的蘋果Siri、Google Now有著顯著的區(qū)別。要解讀AlphaGo,首先我們需要了解AlphaGo背后到底是一個(gè)什么東西。其實(shí)谷歌AlphaGo背后是一套神經(jīng)網(wǎng)絡(luò)系統(tǒng),由 Google 2014 年收購的英國人工智能公司 DeepMind 開發(fā)。這個(gè)系統(tǒng)和深藍(lán)不同,不是一臺(tái)超級(jí)計(jì)算機(jī),而是一個(gè)由許多個(gè)數(shù)據(jù)中心作為節(jié)點(diǎn)相連,每個(gè)節(jié)點(diǎn)內(nèi)有著多臺(tái)超級(jí)計(jì)算機(jī)的神經(jīng)網(wǎng)絡(luò)系統(tǒng)。就像人腦,是由 50-100 億個(gè)神經(jīng)元所組成的,這也是為什么這種機(jī)器學(xué)習(xí)架構(gòu)被稱為神經(jīng)網(wǎng)絡(luò)。
AlphaGo 是在這個(gè)神經(jīng)網(wǎng)絡(luò)系統(tǒng)上,專為下圍棋 (Go) 而開發(fā)出的一個(gè)實(shí)例。然而,雖然名字已經(jīng)介紹了它的功能,AlphaGo 背后的神經(jīng)網(wǎng)絡(luò)系統(tǒng)卻適合用于任何智力競(jìng)技類項(xiàng)目。
其實(shí)“Master”的棋手就是AlphaGo的升級(jí)版
1月5日消息,谷歌DeepMind開發(fā)的AI在圍棋棋盤上戰(zhàn)勝韓國世界冠軍之后再度重返,2016年12月29日至2017年1月4日,谷歌AlphaGo的升級(jí)版本以Master為名,在弈城圍棋網(wǎng)和野狐圍棋網(wǎng)的快棋比賽中對(duì)人類最高水平的選手取得了60:0的壓倒戰(zhàn)績(jī),再次讓人們對(duì)圍棋AI的實(shí)力感到震驚。5日早些時(shí)候,谷歌DeepMind創(chuàng)始人丹米斯·哈撒比斯(Demis Hassabis)在Twitter發(fā)布消息,證實(shí)升級(jí)版AlphaGo在網(wǎng)上與真人對(duì)決。
哈撒比斯寫道:“在過去幾天里,我們?cè)诰W(wǎng)上進(jìn)行了一些非正式圍棋比賽,對(duì)局以快棋的形式進(jìn)行……我們的目的只是為了查看系統(tǒng)是否如預(yù)期一樣好。”他 還說:“感謝那些在弈城圍棋網(wǎng)和野狐圍棋網(wǎng)與我們對(duì)弈的棋手,我們的賬號(hào)是Magister(P) 和Master(P),我們還要感謝那些觀戰(zhàn)的人。”
之前許多人都在猜測(cè)這位圍棋高手是誰,大家都不確定,有人懷疑它是電腦。中國棋手古力懸賞10萬元,尋找可以打敗“Master”的棋手。
DeepMind發(fā)布的消息顯示,非正式測(cè)試可能已經(jīng)結(jié)束,今年晚些時(shí)候,AlphaGo將會(huì)參加一些正式比賽。
一直以來,我們都在努力改進(jìn)AlphaGo,在過去幾天里,我們進(jìn)行了一些非正式網(wǎng)上比賽,對(duì)局以快棋的形式進(jìn)行,參加比賽的是最新開發(fā)的原型版系 統(tǒng),進(jìn)行網(wǎng)上對(duì)決只是為了檢查系統(tǒng),看它是不是和預(yù)料的一樣好。感謝那些在弈城圍棋網(wǎng)和野狐圍棋網(wǎng)與我們對(duì)弈的棋手,我們的賬號(hào)是Magister(P) 和Master(P),我們還要感謝那些觀戰(zhàn)的人。
新版AlphaGo在比賽中下出了一些富有創(chuàng)意、非常漂亮的棋步,我們和圍棋社區(qū)從中學(xué)到了許多東西,對(duì)此我們感到很興奮,結(jié)果讓人滿意。
人工智能大家談:AI在圍棋界已再無對(duì)手,但并不證明在其他領(lǐng)域也是這樣
與AlphaGo對(duì)弈之后,棋手古力發(fā)帖稱:“人類與AI攜手合作,很快將會(huì)揭開圍棋的深層秘密。”現(xiàn)在我們的非正式測(cè)試已經(jīng)結(jié)束,今年我們準(zhǔn)備與圍棋組織、專家合作,舉辦正式、完整的比賽,進(jìn)一步探索圍棋的秘密,讓人類與AI互相啟迪,共同進(jìn)步。很快我們就會(huì)公布更多消息。
Master目前一局未輸,是不是代表人工智能在圍棋界已再無對(duì)手?第四范式CEO戴文淵認(rèn)為基本已成定局。戴文淵稱,機(jī)器學(xué)習(xí)的能力太強(qiáng)了,它是勤奮好學(xué)的不知疲倦的小孩,沒有人能維持這樣的強(qiáng)度,所以人類和機(jī)器的差距會(huì)越來越大。現(xiàn)在想贏機(jī)器,需要頂尖高手戳中機(jī)器盲點(diǎn)這樣的黑天鵝事件才有可能。
對(duì)于Master是否是AlphaGo這個(gè)問題,戴文淵稱這個(gè)已經(jīng)不重要了。因?yàn)锳lphaGo本身的技術(shù)已沒有什么秘密可言,只要有足夠的計(jì)算資源,然后按照AlphaGo的方式去訓(xùn)練一個(gè)下圍棋的程序,最終都能實(shí)現(xiàn)這樣的高水平。戴文淵稱,技術(shù)其實(shí)不需要有特別大的突破,只需要按照原來的方式多訓(xùn)練一段時(shí)間,就會(huì)比原來的AlphaGo更強(qiáng)。不過,雖然從技術(shù)上來說其它公司實(shí)現(xiàn)Master是可能的,但從成本上考慮,應(yīng)該不可能是個(gè)小公司,因?yàn)橛?jì)算成本還是蠻高的。
對(duì)于Master在圍棋界大殺四方的舉動(dòng),出門問問CEO李志飛稱,我不知道(Master)是不是AlphoGo,但堅(jiān)信所有的ArTIficial Games(人工游戲)最終機(jī)器都會(huì)大勝人類。AlphoGo是AI能力的很好demo,但是如果說AlphoGo贏了人類就代表AI智商超過人類完全是 無稽之談,比如說AlphaGo還完全沒有涉及到很多人的智商里的組成如自然語言理解和對(duì)話。
是不是在別的領(lǐng)域訓(xùn)練出一個(gè)AlphaGo也在變得更容易?戴文淵認(rèn)為并不是這樣的,“下棋這個(gè)的場(chǎng)景有著天然的優(yōu)勢(shì),即每天機(jī)器只需要和自己下棋就夠了,不需要外界很多的輸入。類似的場(chǎng)景還有游戲 類競(jìng)技領(lǐng)域,機(jī)器也只需要自己和自己不斷比賽練習(xí)就可以;還有開車、開飛機(jī)等現(xiàn)實(shí)場(chǎng)景,雖然其中會(huì)涉及成本問題但也只需要自己積累數(shù)據(jù)就可完成訓(xùn)練。”戴文淵表示,在其他領(lǐng)域,比方說醫(yī)療領(lǐng)域,想訓(xùn)練出AlphaGo的目標(biāo)就很難實(shí)現(xiàn),因?yàn)椴皇钦f機(jī)器想學(xué)習(xí)案例,就一定恰好有合適的足夠多的病例出現(xiàn),這樣的場(chǎng)景需要外界給予足夠的輸入和配合。