新技術(shù)的發(fā)展將是Facebook AI邁出的重要一步
(文章來源:教育新聞網(wǎng))
Facebook AI Research(FAIR)開發(fā)了一種新的AI,在與Hanabi對抗時產(chǎn)生了令人印象深刻的結(jié)果。新的發(fā)展是Facebook AI邁出的重要一步。
Hanabi是一款類似于紙牌的紙牌游戲。盡管大多數(shù)用于此技術(shù)的游戲(例如國際象棋或圍棋)直接將AI置于人類面前,但Hanabi要求玩家相互合作以實現(xiàn)共同的目標。Facebook雇用機器人在游戲中協(xié)同工作,直到它們超越了以前使用的AI系統(tǒng)。最新的最佳AI系統(tǒng)在游戲中獲得25分的23.92分,而新的AI系統(tǒng)在25分中達到24.61分。
早在2月,Google,DeepMind,卡內(nèi)基梅隆大學(xué)和牛津大學(xué)的研究人員提出了Hanabi基準測試。他們還包括創(chuàng)建能夠玩游戲的其他AI,并將其稱為“ AI研究的新領(lǐng)域”。研究人員對新開發(fā)感到興奮,因為用于幫助機器人的相同AI可能會在其他領(lǐng)域使用。一種可能的用途是改善虛擬助手與人互動的方式。Facebook AI研究人員Noam Brown談到了新的AI系統(tǒng)。
“與此相關(guān)的令人興奮的事情之一是,我們正在觀察到的改進實際上與深度強化學(xué)習(xí)所觀察到的改進正交:您可以將其添加到任何策略之上,它將使它變得更加強大,鮑恩在接受采訪時表示,他對VentureBeat進行了采訪?!拔覀兛吹降慕Y(jié)果遠遠超出了我們或其他研究人員的預(yù)期。實際上,我們從搜索中獲得的收益要強于過去使用的所有深度強化學(xué)習(xí)算法所獲得的收益?!?/p>
Facebook的AI的新發(fā)展是在研究人員不斷開發(fā)能夠與某些最復(fù)雜的游戲抗衡的軟件的時候進行的。2016年,谷歌的DeepMind的AI系統(tǒng)擊敗了中國棋盤游戲Go中最出色的人類玩家。Hanabi圍繞團隊合作和戰(zhàn)略而建立,這是AI實現(xiàn)的重要里程碑,Hanabi現(xiàn)在被認為是測試AI的最佳游戲。在這種環(huán)境下使用時,人工智能可以改善并變得更加復(fù)雜。
Adam Lerer是Facebook研究人員,也是該論文的撰稿人。他說:“我們轉(zhuǎn)向這些合作游戲的原因之一是,我認為我們至少在競爭性游戲方面還沒有剩下任何游戲?!惫{比(Hanabi)由兩到五名球員組成的團隊,每人隨機獲得一張牌??ㄆ念伾煌野煌臄?shù)字,團隊將它們按顏色和正確的數(shù)字順序放在桌子上。
玩家看不到自己的牌,但隊友可以看到。允許玩家給別人提示。例如,一個隊友可以給出有關(guān)顏色的提示,從而導(dǎo)致另一個人玩或棄牌。游戲中較復(fù)雜的方面之一是,玩家必須弄清楚線索及其含義。對于機器人來說,游戲的這一部分很難弄清他們所擁有的信息。
? ? ? ?