當(dāng)前位置:首頁(yè) > 物聯(lián)網(wǎng) > 物聯(lián)網(wǎng)技術(shù)文庫(kù)
[導(dǎo)讀]   人機(jī)圍棋大戰(zhàn)第二局,AlphaGo一手落向空白區(qū)域的37驚呆了世界——李世石看到后離開(kāi)了,遠(yuǎn)程觀(guān)看并解說(shuō)的雷德蒙同樣震撼。這個(gè)西方唯一的九段棋手表示,“我

  人機(jī)圍棋大戰(zhàn)第二局,AlphaGo一手落向空白區(qū)域的37驚呆了世界——李世石看到后離開(kāi)了,遠(yuǎn)程觀(guān)看并解說(shuō)的雷德蒙同樣震撼。這個(gè)西方唯一的九段棋手表示,“我真的不知道這是一步好棋還是壞棋。”而與此同時(shí),美國(guó)圍棋協(xié)會(huì)通訊副總裁英語(yǔ)解說(shuō)員克里斯·加洛克則表示,“這是一個(gè)錯(cuò)誤。”

  這一步李世石長(zhǎng)考了大約二十分鐘,但四個(gè)多小時(shí)候,他還是輸了。后來(lái)的后來(lái),在這場(chǎng)人機(jī)大戰(zhàn)中,鏈接了數(shù)百個(gè)分布在世界各地的谷歌數(shù)據(jù)中心的AI程序,擊敗了可能是有史以來(lái)人類(lèi)設(shè)計(jì)的最復(fù)雜的游戲中最好的選手。

  對(duì)37手同樣產(chǎn)生疑惑的是樊麾,他不只是曾經(jīng)5比0輸給AlphaGo的歐洲圍棋冠軍,而且從那以后,他成為了AlphaGo的陪練。與李世石交戰(zhàn)前的五個(gè)多月里,樊麾與AlphaGo進(jìn)行了上百盤(pán)比賽。他看著AlphaGo一天天地長(zhǎng)大。樊麾失敗的次數(shù)越來(lái)越多,但他是最了解AlphaGo的人。看著AlphaGo的第37手,他深知這其中一定有常人難以理解的地方,計(jì)算10秒后,他表示“竟是如此妙手”。

  對(duì),大多數(shù)人認(rèn)為,AlphaGo的勝利是計(jì)算力的強(qiáng)勢(shì)碾壓,然而,第37手證明AlphaGo不只是計(jì)算,它表現(xiàn)出一定程度理解圍棋的能力,就像人類(lèi)棋手一樣,具有“棋感”。所以,37手具有歷史性的意義,它表明機(jī)器和人類(lèi)終于開(kāi)始有了真正融合的一天。

  AlphaGo創(chuàng)始人哈薩比斯1976年生于倫敦,他4歲開(kāi)始接觸國(guó)際象棋,13歲晉身“大師級(jí)”(chess master),在14歲以下棋手中名列世界第二。AlphaGo團(tuán)隊(duì)的領(lǐng)導(dǎo)者席爾瓦說(shuō)道,“我曾見(jiàn)他出現(xiàn)在我們鎮(zhèn)上,贏得了比賽,然后離開(kāi)。” 他們兩人在劍橋讀本科時(shí)正式見(jiàn)了面。為了了解人類(lèi)的思維,研究機(jī)器是否也能變得智能,兩人的專(zhuān)業(yè)都是計(jì)算神經(jīng)科學(xué)。哈薩比斯在倫敦大學(xué)學(xué)院(UCL)攻讀認(rèn)知神經(jīng)科學(xué)博士課程時(shí),主攻腦部負(fù)責(zé)導(dǎo)航、回憶及想像的海馬回(hippocampus) ,為打造思考方式更近似人類(lèi)的電腦打下基礎(chǔ),他提出的新理論獲《科學(xué)》雜志評(píng)為2007年十大科技突破。

  1997年IBM深藍(lán)電腦擊敗國(guó)際象棋冠軍時(shí),正好是哈薩比斯在劍橋大學(xué)攻讀電腦科學(xué)的時(shí)候。那時(shí)他在劍橋內(nèi)第一次接觸到圍棋——這個(gè)已有千年歷史的棋類(lèi)運(yùn)動(dòng),而剛剛接觸圍棋的哈薩比斯忍不住思考:為什么機(jī)器從未破解這種智力游戲?也因?yàn)槿绱耍_比斯暗下決心,希望做出一個(gè)下圍棋勝過(guò)人類(lèi)的電腦系統(tǒng)。用博弈論的術(shù)語(yǔ)講,圍棋與國(guó)際象棋和西洋跳棋一樣,是一種完全信息博弈游戲——毫無(wú)運(yùn)氣可言,信息完全公開(kāi)。通常來(lái)說(shuō),電腦應(yīng)該輕松就能將其掌握,但其就是攻克不下圍棋。

  哈薩比斯表示,在圍棋中,無(wú)論是人類(lèi)還是機(jī)器都無(wú)法算出每一步的最終結(jié)果,頂級(jí)棋手靠的是直覺(jué),而非硬算——即是棋感。“圍棋布局講究美學(xué),好的布局看起來(lái)充滿(mǎn)美感。”

  1998年,兩人畢業(yè)后合開(kāi)了一家電子游戲公司。游戲是檢驗(yàn)人工智能的好辦法。但在2005年,他們的游戲公司倒閉了。席爾瓦去了阿爾伯塔大學(xué)研究人工智能的初級(jí)形式——增強(qiáng)學(xué)習(xí)。增強(qiáng)學(xué)習(xí)技術(shù)讓機(jī)器可以重復(fù)同樣的任務(wù),找出效果最佳的決策,從而實(shí)現(xiàn)自主學(xué)習(xí)。哈薩比斯則去到了英國(guó)倫敦大學(xué)學(xué)院,獲得了神經(jīng)系統(tǒng)學(xué)的博士學(xué)位。兩人的專(zhuān)業(yè)都是計(jì)算神經(jīng)科學(xué),為了研究機(jī)器是否也能變得智能。2010年,他們?cè)俅蜗嗑?mdash;—哈薩比斯在倫敦成立了一個(gè)名為DeepMind的人工智能公司,席爾瓦則加入了他。

  當(dāng)谷歌CEO布林遇見(jiàn)哈薩比斯時(shí),哈薩比斯說(shuō):“幾年內(nèi),DeepMind或許能打敗世界圍棋冠軍。”連以遠(yuǎn)見(jiàn)卓著的布林也覺(jué)得不可思議,但他們做到了。

  人機(jī)大戰(zhàn)第二局結(jié)束后,席爾瓦進(jìn)入AlphaGo的控制室,監(jiān)控其運(yùn)行是否正常,并跟蹤它對(duì)每場(chǎng)對(duì)弈結(jié)局的預(yù)測(cè)有何變化。 席爾瓦調(diào)出了AlphaGo在對(duì)弈期間做出的決策記錄,查看AlphaGo在下出第37手的前一刻發(fā)生了什么。

  在DeepMind和AlphaGo出現(xiàn)之前,機(jī)器下棋都依靠暴力破解的方法,即窮舉,IBM的深藍(lán)用的就是這種。當(dāng)時(shí),深藍(lán)也走出了人類(lèi)意料之外的一步,但是,暴力計(jì)算解決不了圍棋。圍棋有太多變化,電腦都無(wú)法硬算。

  所以,DeepMind只能另辟蹊徑——機(jī)器學(xué)習(xí)。

  DeepMind團(tuán)隊(duì)將3000萬(wàn)步人類(lèi)下出的圍棋步法輸入到一個(gè)深度神經(jīng)網(wǎng)絡(luò)中。這個(gè)網(wǎng)絡(luò)模擬人腦中的神經(jīng)網(wǎng),團(tuán)隊(duì)也希望它能夠像人腦一樣思考,自主學(xué)習(xí)。比如Facebook的計(jì)算機(jī)視覺(jué)技術(shù),谷歌的語(yǔ)音識(shí)別。觀(guān)察足夠多的貓,它就能認(rèn)出貓;輸入足夠多的語(yǔ)言數(shù)據(jù),它就能聽(tīng)懂自然語(yǔ)言;同樣,輸入足夠多的棋譜,它也能學(xué)會(huì)如何下棋。但是,創(chuàng)意聯(lián)想與規(guī)則運(yùn)用是兩碼事,比如37手并不在那3000萬(wàn)步棋譜之中,那么它是如何做到的呢?事實(shí)上,AlphaGo還計(jì)算出,一名人類(lèi)專(zhuān)業(yè)棋手下出這樣一步的概率大約只有萬(wàn)分之一,但它還是選擇了這一步。

  “它知道職業(yè)棋手這么下的幾率很低,但當(dāng)它經(jīng)過(guò)自己的計(jì)算后,它可以推翻原先輸入的棋譜參考,”席爾瓦解釋道,從某種意義上來(lái)說(shuō),AlphaGo開(kāi)始自主思考。它做出的決定不是以其創(chuàng)造者在其數(shù)字DNA中編入的規(guī)則為基礎(chǔ)的,而是以其自學(xué)的算法為基礎(chǔ)的。

  讓它自己學(xué)會(huì)了下棋后,席爾瓦讓AlphaGo和自己對(duì)弈——一個(gè)與其版本不一樣的神經(jīng)網(wǎng)絡(luò)。在自我對(duì)弈訓(xùn)練過(guò)程中,AlphaGo記錄起那些最優(yōu)的走法——這就是席爾瓦曾研究的增強(qiáng)學(xué)習(xí)技術(shù)。

  給自己打譜——這是棋力提高的有效方法,但這是部分技巧。懂得分析局面、有了邏輯計(jì)算還不夠,在茫茫棋盤(pán)中找到妙手還要靠直覺(jué),就是根據(jù)棋形進(jìn)行的感性預(yù)測(cè)。在增強(qiáng)學(xué)習(xí)技術(shù)實(shí)現(xiàn)后,席爾瓦的團(tuán)隊(duì)將這些非人類(lèi)圍棋步法輸入到第二個(gè)神經(jīng)網(wǎng)絡(luò)中,教它像深藍(lán)那樣預(yù)測(cè)國(guó)際象棋棋局一樣預(yù)測(cè)圍棋的棋局。將其與自己對(duì)弈多場(chǎng)后收集到的所有信息輸進(jìn)去后,AlphaGo開(kāi)始可以預(yù)測(cè)一場(chǎng)圍棋對(duì)弈可能展開(kāi)的方式。這便是直覺(jué)。比如AlphaGo的37手。即使回到后臺(tái)查看過(guò)程的席爾瓦,也無(wú)法知道AlphaGo是如何得出這個(gè)結(jié)果——這就是棋感的形成。

  AlphaGo是 DeepMind 跨入 AI 領(lǐng)域的重要一步,但對(duì)于“AI取代人類(lèi)論”,哈薩比斯表示無(wú)需擔(dān)心,在他看來(lái),AI是一個(gè)工具,一個(gè)結(jié)構(gòu)智慧,讓人類(lèi)更好的工具。雖然AlphaGo目前有這樣的能力,但它未必真的知道“自己”在做什么。所以,利用這樣一個(gè)工具,哈薩比斯又是如何設(shè)想未來(lái)5年的AI世界的呢?谷歌花6.5億美元收購(gòu)一家公司,不會(huì)只是玩一場(chǎng)棋牌游戲。

  有了深度學(xué)習(xí)和自主思維能力,AlphaGo今天可以下棋,明天就可以學(xué)設(shè)計(jì)。深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)支撐著十多項(xiàng)由谷歌提供的服務(wù),包括它那無(wú)所不能的搜索引擎。AlphaGo另一個(gè)不那么秘密的武器——增強(qiáng)學(xué)習(xí)已經(jīng)在教導(dǎo)該公司的實(shí)驗(yàn)室機(jī)器人們拿起并移動(dòng)各種物品。

  但是,商業(yè)問(wèn)題并不是最重要的。當(dāng)詢(xún)問(wèn)哈薩比斯,看見(jiàn)李世石輸了比賽他作何感想時(shí),他指著心口說(shuō):“我很難過(guò)。” 看到自己創(chuàng)造的成果他感到驕傲,但出于人類(lèi)本能,他感到難過(guò),他希望李世石能夠贏下一局。


本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀(guān)點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專(zhuān)欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車(chē)的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車(chē)技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車(chē)工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車(chē)。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車(chē) 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶(hù)希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱(chēng),數(shù)字世界的話(huà)語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱(chēng)"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉