賭神電影要重拍了人工智能玩牌技術(shù)無敵手

時(shí)間：2020-08-13 20:33:01

關(guān)鍵字：人工智能阿爾法

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀] 歷經(jīng)20多天的鏖戰(zhàn)，4名頂尖德州撲克選手有些落寞：終于還是輸了。這一次，擊敗他們的“賭神”是美國(guó)卡內(nèi)基－梅隆大學(xué)開發(fā)的人工智能“Libratus”

歷經(jīng)20多天的鏖戰(zhàn)，4名頂尖德州撲克選手有些落寞：終于還是輸了。這一次，擊敗他們的“賭神”是美國(guó)卡內(nèi)基－梅隆大學(xué)開發(fā)的人工智能“Libratus”。

　　每天近11小時(shí)的比賽后，人類選手仍不顧疲憊討論第二天的策略，但人工智能似乎能猜透他們的心思。每當(dāng)他們欣喜若狂地發(fā)現(xiàn)人工智能的策略漏洞，這一漏洞在下一天就會(huì)被填補(bǔ)。

　　美國(guó)匹茲堡的一家賭場(chǎng)這次成為“人機(jī)大戰(zhàn)”的最新戰(zhàn)場(chǎng)，“Libratus”在那里與4名人類選手共玩了12萬手一對(duì)一不限注的德州撲克。比賽從1月11日持續(xù)到30日，結(jié)束時(shí)，人工智能領(lǐng)先人類選手共約177萬美元的籌碼。

　　今年早些時(shí)候，加拿大艾伯塔大學(xué)和捷克兩所高校的研究人員開發(fā)的人工智能“DeepStack”已首次在一對(duì)一無限注德州撲克中擊敗人類職業(yè)玩家。

　　過去20多年，國(guó)際象棋、中國(guó)象棋、拼字游戲、圍棋……人們心情復(fù)雜地見證了人工智能步步攻陷人類智慧的堡壘。不過，又是下棋又是打牌，難道人工智能就只會(huì)玩耍嗎？

　　其實(shí)，正如益智游戲有利于兒童成長(zhǎng)，棋牌類游戲是幫助人工智能“開發(fā)智力”的手段而不是目標(biāo)。不同的游戲?qū)θ斯ぶ悄芴岢隽瞬煌募夹g(shù)挑戰(zhàn)。

　　兩度出手皆獲勝的“阿爾法圍棋”，是要培養(yǎng)人工智能基于復(fù)雜信息的決策能力。一盤圍棋游戲約有10的170次方個(gè)決策點(diǎn)，是所有棋類游戲中最多的，需要具有極大計(jì)算能力的人工智能，通過預(yù)測(cè)所有未來步驟的勝率來決策。

　　圍棋是一種“完美信息”博弈，信息完全公開，玩家可以看到棋盤上的棋子，并預(yù)測(cè)落子可能性。而德州撲克玩家手中的底牌是其他玩家看不到的，因此是“不完美信息”博弈，要求更復(fù)雜的推理能力，對(duì)人工智能更具挑戰(zhàn)。

　　此外，要想玩好德州撲克，人工智能還得懂點(diǎn)心理學(xué)。德州撲克中有一經(jīng)典策略——詐唬，即在手握弱牌時(shí)依然虛張聲勢(shì)地加注，以嚇退對(duì)手。對(duì)手是不是在詐唬？自己要何時(shí)詐唬還不被識(shí)破？這些都為編寫人工智能程序提供了挑戰(zhàn)。

　　德州撲克“人機(jī)大戰(zhàn)”中也有人工智能不堪回首的歷史，卡內(nèi)基－梅隆大學(xué)開發(fā)的一個(gè)較早版本的人工智能“Claudico”在2015年的比賽中輸給人類選手。那么，此次卷土重來的“Libratus”靠什么成功“復(fù)仇”？

　　其實(shí)，“Libratus”的名字隱含了它勝利的秘訣，這個(gè)拉丁文詞語的含義是“均衡”，代表著程序所用到的均衡博弈。奧斯卡獲獎(jiǎng)影片《美麗心靈》的主人公原型約翰·納什在20世紀(jì)50年代提出“納什均衡”理論，又稱為非合作博弈均衡，保證使得同一時(shí)間內(nèi)每個(gè)參與者的策略是對(duì)其他參與人策略的最優(yōu)反應(yīng)。

　　德州撲克是“不完美信息”博弈，無法像下圍棋一般計(jì)算所有下一步的可能性來決策，研究人員便改進(jìn)人工智能的算法，讓其應(yīng)用均衡博弈，通過平衡風(fēng)險(xiǎn)與收益來決定下一步，以達(dá)到納什均衡定義中的完美狀態(tài)。此外，研究人員還升級(jí)了人工智能的計(jì)算能力。

　　而機(jī)器學(xué)習(xí)技術(shù)依然是人工智能在近年來進(jìn)步神速的關(guān)鍵。開發(fā)者說，他們并未教“Libratus”如何打撲克，只是告訴它撲克的規(guī)則，讓它通過幾萬億次的自我對(duì)戰(zhàn)尋找到獲勝策略。在比賽日的每個(gè)晚上，開發(fā)者還會(huì)將其與匹茲堡的超級(jí)計(jì)算機(jī)聯(lián)網(wǎng)改進(jìn)算法，這也是它總能在人類對(duì)手制衡自己之前搶先一步的原因。

　　除了在牌桌上贏得風(fēng)生水起，掌握博弈論的人工智能在現(xiàn)實(shí)生活中也大有用武之地，如金融交易、拍賣、政治和商業(yè)談判、軍事或網(wǎng)絡(luò)安全策略以及規(guī)劃醫(yī)療方案等。以后，凡是需要基于“不完美信息”作出戰(zhàn)略決策時(shí)，人工智能都可能給出最優(yōu)解。