李世石VS AlphaGo 人機(jī)對(duì)弈電腦能打敗人腦嗎
北京時(shí)間明天,舉世矚目的圍棋“人機(jī)大戰(zhàn)”將在韓國(guó)首爾上演,比賽一方為谷歌公司研制的人工智能程序AlphaGo,另一方則是圍棋世界冠軍、韓國(guó)名將李世石九段。雙方將進(jìn)行5盤較量,勝者將贏得100萬美元的獎(jiǎng)金。究竟是擁有1200個(gè)CPU的AlphaGo厲害,還是最近10年擁有最多世界冠軍頭銜的李世石厲害?記者昨天采訪了中國(guó)圍棋界的多位人士,大家普遍看好人腦戰(zhàn)勝電腦。
AlphaGo曾擊敗職業(yè)棋手
所謂圍棋“人機(jī)大戰(zhàn)”,就是擁有人工智能的計(jì)算機(jī)電腦程序與真實(shí)棋手過招的一種對(duì)弈形式。在棋類領(lǐng)域,此前曾有會(huì)下國(guó)際象棋的超級(jí)計(jì)算機(jī)“深藍(lán)”,在“人機(jī)大戰(zhàn)”中擊敗世界棋王、國(guó)際象棋領(lǐng)軍人物卡斯帕羅夫的驚世之舉。
近年來,超級(jí)計(jì)算機(jī)憑借強(qiáng)大的運(yùn)算和編程能力,幾乎在所有棋類比賽中都有擊敗棋手的記錄。唯獨(dú)在圍棋領(lǐng)域,電腦依然如蹣跚學(xué)步的孩子般緩慢前行。由于圍棋不像國(guó)際象棋那樣擁有固定的幾類棋子,比賽中的變化很多,因此設(shè)計(jì)程序的復(fù)雜程度遠(yuǎn)超國(guó)際象棋。很多業(yè)內(nèi)人士認(rèn)為,電腦圍棋程序如同人工智能領(lǐng)域里的哥德巴赫猜想,還無法真正讓頂尖圍棋高手頭疼。
不過,這次即將登場(chǎng)的AlphaGo可不是實(shí)力平庸的“臭棋簍子”,去年10月它在沒有讓子的情況下以5比0戰(zhàn)勝了歐洲圍棋冠軍、職業(yè)二段棋手樊麾。
AlphaGo與樊麾交手的棋譜一經(jīng)公開,中國(guó)和韓國(guó)多名頂尖職業(yè)棋手都對(duì)電腦的棋力表示驚訝。中國(guó)著名棋手、世界冠軍常昊認(rèn)為,從電腦的表現(xiàn)來看,已絕對(duì)可以算作職業(yè)“棋手”,它的思考方式、布局和應(yīng)對(duì)都有職業(yè)棋手的風(fēng)范。
AlphaGo一天能下百萬盤棋
那么,這個(gè)神秘的AlphaGo究竟有什么絕招能讓棋手感到“壓力山大”呢?
據(jù)相關(guān)程序研發(fā)者透露,AlphaGo是谷歌旗下一間實(shí)驗(yàn)室制造的一款人工智能圍棋程序(機(jī)器人)。該研究項(xiàng)目啟動(dòng)已有兩年時(shí)間。選擇圍棋作為程序的研究方向,主要是因?yàn)閲逵兄鴩?guó)際象棋不可比擬的變化量,尤其棋手的直觀、洞察力,對(duì)棋局的走勢(shì)起著決定性作用。因此,圍棋一直被認(rèn)為是人工智能無法戰(zhàn)勝人類的領(lǐng)域,而谷歌則想打破這個(gè)“不可能”。
AlphaGo擁有強(qiáng)大的計(jì)算能力,可以預(yù)測(cè)每次落子后的諸多變化趨勢(shì)。通過蒙特卡洛樹搜索,借助估值網(wǎng)絡(luò)(value network)與策略網(wǎng)絡(luò)(policy network)兩種深度計(jì)算模式完成評(píng)估、選點(diǎn)。
據(jù)了解,AlphaGo會(huì)在比賽中分析每一步棋的風(fēng)險(xiǎn)系數(shù),比如在未來20步棋的多種變化情況下,它立即就能判斷出在哪個(gè)點(diǎn)落子的勝率最高。另外,AlphaGo還擁有像人類一樣的學(xué)習(xí)和進(jìn)化能力。研發(fā)者表示,“棋手在長(zhǎng)時(shí)間的比賽中會(huì)因疲勞而犯錯(cuò),但電腦程序不會(huì)。一個(gè)棋手可能一年只能下1000多盤棋,而AlphaGo一天就能下100萬盤。”
而且,在贏得去年的“人機(jī)大戰(zhàn)”后,研發(fā)者還不斷地讓AlphaGo“學(xué)習(xí)”新的棋譜,提高實(shí)戰(zhàn)能力。目前AlphaGo的棋力較去年又有了一定程度的提升。這對(duì)即將出戰(zhàn)“人機(jī)大戰(zhàn)”的李世石來說無疑是個(gè)挑戰(zhàn)。據(jù)了解,谷歌認(rèn)為AlphaGo與李世石的實(shí)力是五五開,勝負(fù)結(jié)果不好預(yù)測(cè)。
李世石對(duì)取勝充滿信心
在韓國(guó)圍棋界,有兩位李姓棋手因長(zhǎng)時(shí)間保持世界頂尖水平而聲名遠(yuǎn)播,一位是李昌鎬,另一位就是李世石。作為最近10年來獲得世界冠軍頭銜最多的圍棋棋手,李世石被看做最能代表人類挑戰(zhàn)電腦的頂尖棋手。
“同AlphaGo的較量將是我職業(yè)生涯最重要的比賽之一。”據(jù)李世石透露,他只用了幾分鐘的思考時(shí)間就決定接受這項(xiàng)比賽任務(wù)。當(dāng)時(shí),谷歌公司確定了3名參與“人機(jī)大戰(zhàn)”的候選棋手,除李世石外,還有近來風(fēng)頭正盛的中國(guó)棋手柯潔,以及日本的井山裕太九段。
谷歌公司去年底找到李世石,希望他參加這場(chǎng)“人機(jī)大戰(zhàn)”。李世石幾乎沒有考慮得失,就痛快地答應(yīng)下來。其實(shí),他當(dāng)時(shí)并不清楚AlphaGo有多厲害,也沒看過它同樊麾二段的對(duì)局棋譜。直到簽完保密合同,李世石才知道,他與AlphaGo的對(duì)決不僅備受關(guān)注,且獎(jiǎng)金豐厚。
“這場(chǎng)比賽本身的意義,要比獎(jiǎng)金重要得多,因?yàn)槲覍⒋砣祟愅娔X對(duì)戰(zhàn)。”李世石直言,“這種比賽,說沒有壓力是不可能的,這種壓力是我此前和棋手比賽時(shí)不曾感受到的。”
展望“人機(jī)大戰(zhàn)”,李世石充滿信心,“這是我不能輸?shù)谋荣?,甚至一盤棋都不能輸。我希望能以5比0或者4比1取勝。”
中國(guó)圍棋界看好李世石
即將到來的“人機(jī)大戰(zhàn)”不僅吸引著韓國(guó)圍棋界的目光,也牽動(dòng)著中國(guó)圍棋界。個(gè)性張揚(yáng)的19歲棋手柯潔預(yù)測(cè)說:“如果讓我拿出100塊錢,我會(huì)全部押在李世石身上,我相信他會(huì)以5比0取勝。”
柯潔認(rèn)為,雙方下完第一盤后,就能看出比賽走勢(shì),他相信電腦程序的實(shí)力目前還無法和李世石相比,比賽過程和結(jié)果一定是強(qiáng)弱分明。至于看好李世石的原因,柯潔解釋道:“對(duì)圍棋選手來說,轉(zhuǎn)入職業(yè)后再想向頂尖進(jìn)步是很困難的。AlphaGo如果現(xiàn)在模擬人的思維,大概它也會(huì)遇到這個(gè)瓶頸。”
和柯潔一樣,中國(guó)棋手常昊也認(rèn)為李世石勝面很大,“正常情況下,李世石應(yīng)該一盤都不會(huì)輸。如果電腦能贏一盤,那應(yīng)該算是非常大的突破了,因?yàn)槟且呀?jīng)說明它具備了跟頂尖棋手抗衡的能力。”
中國(guó)圍棋協(xié)會(huì)主席王汝南同樣認(rèn)為李世石取勝的可能性更大,不過他感覺電腦近年來的進(jìn)步非??欤?ldquo;希望人類能多堅(jiān)持幾年,畢竟兩者抗衡時(shí)間越長(zhǎng),可能越有助于圍棋項(xiàng)目的發(fā)展。”
新聞
1996年,來自俄羅斯的國(guó)際象棋大師卡斯帕羅夫與IBM公司研制的超級(jí)計(jì)算機(jī)“深藍(lán)”交手。“深藍(lán)”被輸入了100多年來優(yōu)秀棋手的200多萬局對(duì)局,每秒鐘可以計(jì)算2億步。最終,卡斯帕羅夫以4比2贏得了這場(chǎng)舉世矚目的“人機(jī)大戰(zhàn)”,并獲得40萬美元獎(jiǎng)金。賽后,卡斯帕羅夫當(dāng)即同意給計(jì)算機(jī)“復(fù)仇”的機(jī)會(huì)。
1997年,經(jīng)IBM公司改進(jìn)的“深藍(lán)”有了更深的功力,運(yùn)算速度提高一倍,因此又被稱為“更深的藍(lán)”。在與卡斯帕羅夫進(jìn)行的第二番“人機(jī)大戰(zhàn)”中,“深藍(lán)”憑借強(qiáng)大的計(jì)算能力以3.5比2.5取勝。這是計(jì)算機(jī)在正常時(shí)限的比賽中首次擊敗等級(jí)分排名世界第一的國(guó)際象棋棋手。盡管卡斯帕羅夫?qū)?ldquo;深藍(lán)”的行棋方式提出質(zhì)疑,但I(xiàn)BM公司表示并不打算繼續(xù)比賽。最后IBM公司將“深藍(lán)”拆散,分成兩部分收藏,其中一部分被放到博物館里,因此卡斯帕羅夫失去了“復(fù)仇”的機(jī)會(huì)。