當(dāng)前位置:首頁 > 智能硬件 > 人工智能AI
[導(dǎo)讀] 歷經(jīng)20多天的鏖戰(zhàn),4名頂尖德州撲克選手有些落寞:終于還是輸了。這一次,擊敗他們的“賭神”是美國(guó)卡內(nèi)基-梅隆大學(xué)開發(fā)的人工智能“Libratus”

歷經(jīng)20多天的鏖戰(zhàn),4名頂尖德州撲克選手有些落寞:終于還是輸了。這一次,擊敗他們的“賭神”是美國(guó)卡內(nèi)基-梅隆大學(xué)開發(fā)的人工智能“Libratus”。

  每天近11小時(shí)的比賽后,人類選手仍不顧疲憊討論第二天的策略,但人工智能似乎能猜透他們的心思。每當(dāng)他們欣喜若狂地發(fā)現(xiàn)人工智能的策略漏洞,這一漏洞在下一天就會(huì)被填補(bǔ)。

  美國(guó)匹茲堡的一家賭場(chǎng)這次成為“人機(jī)大戰(zhàn)”的最新戰(zhàn)場(chǎng),“Libratus”在那里與4名人類選手共玩了12萬手一對(duì)一不限注的德州撲克。比賽從1月11日持續(xù)到30日,結(jié)束時(shí),人工智能領(lǐng)先人類選手共約177萬美元的籌碼。

  今年早些時(shí)候,加拿大艾伯塔大學(xué)和捷克兩所高校的研究人員開發(fā)的人工智能“DeepStack”已首次在一對(duì)一無限注德州撲克中擊敗人類職業(yè)玩家。

  過去20多年,國(guó)際象棋、中國(guó)象棋、拼字游戲、圍棋……人們心情復(fù)雜地見證了人工智能步步攻陷人類智慧的堡壘。不過,又是下棋又是打牌,難道人工智能就只會(huì)玩耍嗎?

  其實(shí),正如益智游戲有利于兒童成長(zhǎng),棋牌類游戲是幫助人工智能“開發(fā)智力”的手段而不是目標(biāo)。不同的游戲?qū)θ斯ぶ悄芴岢隽瞬煌募夹g(shù)挑戰(zhàn)。

  兩度出手皆獲勝的“阿爾法圍棋”,是要培養(yǎng)人工智能基于復(fù)雜信息的決策能力。一盤圍棋游戲約有10的170次方個(gè)決策點(diǎn),是所有棋類游戲中最多的,需要具有極大計(jì)算能力的人工智能,通過預(yù)測(cè)所有未來步驟的勝率來決策。

  圍棋是一種“完美信息”博弈,信息完全公開,玩家可以看到棋盤上的棋子,并預(yù)測(cè)落子可能性。而德州撲克玩家手中的底牌是其他玩家看不到的,因此是“不完美信息”博弈,要求更復(fù)雜的推理能力,對(duì)人工智能更具挑戰(zhàn)。

  此外,要想玩好德州撲克,人工智能還得懂點(diǎn)心理學(xué)。德州撲克中有一經(jīng)典策略——詐唬,即在手握弱牌時(shí)依然虛張聲勢(shì)地加注,以嚇退對(duì)手。對(duì)手是不是在詐唬?自己要何時(shí)詐唬還不被識(shí)破?這些都為編寫人工智能程序提供了挑戰(zhàn)。

  德州撲克“人機(jī)大戰(zhàn)”中也有人工智能不堪回首的歷史,卡內(nèi)基-梅隆大學(xué)開發(fā)的一個(gè)較早版本的人工智能“Claudico”在2015年的比賽中輸給人類選手。那么,此次卷土重來的“Libratus”靠什么成功“復(fù)仇”?

  其實(shí),“Libratus”的名字隱含了它勝利的秘訣,這個(gè)拉丁文詞語的含義是“均衡”,代表著程序所用到的均衡博弈。奧斯卡獲獎(jiǎng)影片《美麗心靈》的主人公原型約翰·納什在20世紀(jì)50年代提出“納什均衡”理論,又稱為非合作博弈均衡,保證使得同一時(shí)間內(nèi)每個(gè)參與者的策略是對(duì)其他參與人策略的最優(yōu)反應(yīng)。

  德州撲克是“不完美信息”博弈,無法像下圍棋一般計(jì)算所有下一步的可能性來決策,研究人員便改進(jìn)人工智能的算法,讓其應(yīng)用均衡博弈,通過平衡風(fēng)險(xiǎn)與收益來決定下一步,以達(dá)到納什均衡定義中的完美狀態(tài)。此外,研究人員還升級(jí)了人工智能的計(jì)算能力。

  而機(jī)器學(xué)習(xí)技術(shù)依然是人工智能在近年來進(jìn)步神速的關(guān)鍵。開發(fā)者說,他們并未教“Libratus”如何打撲克,只是告訴它撲克的規(guī)則,讓它通過幾萬億次的自我對(duì)戰(zhàn)尋找到獲勝策略。在比賽日的每個(gè)晚上,開發(fā)者還會(huì)將其與匹茲堡的超級(jí)計(jì)算機(jī)聯(lián)網(wǎng)改進(jìn)算法,這也是它總能在人類對(duì)手制衡自己之前搶先一步的原因。

  除了在牌桌上贏得風(fēng)生水起,掌握博弈論的人工智能在現(xiàn)實(shí)生活中也大有用武之地,如金融交易、拍賣、政治和商業(yè)談判、軍事或網(wǎng)絡(luò)安全策略以及規(guī)劃醫(yī)療方案等。以后,凡是需要基于“不完美信息”作出戰(zhàn)略決策時(shí),人工智能都可能給出最優(yōu)解。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉