人工智能領(lǐng)域面臨極化巨頭實(shí)驗(yàn)室或?qū)⒅髟譇I未來

時(shí)間：2020-06-03 16:15:01

關(guān)鍵字：三維技術(shù) 人工智能

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀] 國(guó)際象棋和圍棋曾是孩子的游戲?，F(xiàn)在AI正在贏得奪旗游戲。這些技能最終會(huì)轉(zhuǎn)化到現(xiàn)實(shí)世界嗎？孩子們會(huì)在夏季營(yíng)地開放空間玩奪旗這個(gè)游戲；同時(shí)，爭(zhēng)奪旗子這個(gè)游戲畫面也是Quake III和Ov

國(guó)際象棋和圍棋曾是孩子的游戲?，F(xiàn)在AI正在贏得奪旗游戲。這些技能最終會(huì)轉(zhuǎn)化到現(xiàn)實(shí)世界嗎？

孩子們會(huì)在夏季營(yíng)地開放空間玩奪旗這個(gè)游戲；同時(shí)，爭(zhēng)奪旗子這個(gè)游戲畫面也是Quake III和Overwatch等熱門游戲的一部分。

無論是哪種情況，這都是一項(xiàng)團(tuán)隊(duì)運(yùn)動(dòng)。每一方都守衛(wèi)一面旗幟，同時(shí)還要計(jì)劃如何抓住對(duì)方的旗幟并將其帶回到自己的大本營(yíng)。贏得比賽需要良好的老式團(tuán)隊(duì)合作以及協(xié)調(diào)防守和攻擊之間的平衡。

換句話說，奪得旗幟需要一套看起來似乎只有人工才能操作的技能。但倫敦一家人工智能實(shí)驗(yàn)室的研究人員表明，機(jī)器也可以攻克這項(xiàng)游戲，至少在虛擬世界中是可以的。

在五月三十日發(fā)表在《科學(xué)》雜志上的一篇論文中，研究人員稱他們?cè)赒uake III游戲的奪旗環(huán)節(jié)中設(shè)計(jì)了自動(dòng)“代理人”，這些“代理人”表現(xiàn)的就跟人類在操作一樣。這些代理人能夠自行組隊(duì)來對(duì)抗人類玩家，也可以與他們并肩作戰(zhàn)，根據(jù)情況相應(yīng)地調(diào)整自己的行為。

隸屬于Alphabet的DeepMind實(shí)驗(yàn)室的研究員Wojciech Czarnecki表示：“這些代理人可以適應(yīng)具有任意技能的隊(duì)友?！?/p>

通過數(shù)千小時(shí)的游戲，代理人學(xué)會(huì)了非常特殊的技能，比如在隊(duì)友即將獲得旗幟的情況下極速跑去攻擊對(duì)手的大本營(yíng)。正如人類玩家所知，當(dāng)對(duì)方旗幟被奪得并帶到自己的大本營(yíng)時(shí)，對(duì)家的大本營(yíng)中會(huì)出現(xiàn)一面可以搶奪的新旗。

DeepMind的項(xiàng)目是努力構(gòu)建人工智能應(yīng)用于復(fù)雜三維動(dòng)畫游戲的一部分，這些三維動(dòng)畫游戲包括Quake III、Dota 2和星際爭(zhēng)霸II。許多研究人員認(rèn)為：虛擬領(lǐng)域的成功最終將提升現(xiàn)實(shí)世界中人工智能的應(yīng)用能力。

例如，這些技能可以使倉庫機(jī)器人受益——當(dāng)他們分組工作將貨物從一個(gè)地方移動(dòng)到另一個(gè)地方時(shí)，或者幫助自動(dòng)駕駛汽車在交通擁堵時(shí)集中導(dǎo)航。位于舊金山的OpenAI實(shí)驗(yàn)室有著類似研究項(xiàng)目，項(xiàng)目負(fù)責(zé)人Greg Brockman說道：“游戲一直是AI的基準(zhǔn)。如果不能攻克游戲難題，就不能指望AI解決其他問題?！?/p>

直到最近，在像Quake III這樣的游戲中構(gòu)建一個(gè)可以匹配人類玩家的系統(tǒng)才成為可能，以前看來似乎是不可能的。但是在過去的幾年里，DeepMind、OpenAI以及其他實(shí)驗(yàn)室取得了重大進(jìn)展，這要?dú)w功于一種稱為“強(qiáng)化學(xué)習(xí)”的數(shù)學(xué)技術(shù)，這種技術(shù)使得機(jī)器能通過極端的反復(fù)試驗(yàn)和試錯(cuò)來學(xué)習(xí)。

通過一遍又一遍地玩游戲，這些自動(dòng)代理人可以了解哪些策略能成功，哪些策略不成功。如果代理人在隊(duì)友即將奪旗的情況下通過向?qū)κ值拇蟊緺I(yíng)移動(dòng)而不斷贏得更多積分，則會(huì)將這種策略添加到他的游戲策略中。

在2016年，同樣使用這項(xiàng)基礎(chǔ)技術(shù)，DeepMind研究人員構(gòu)建了使得AlphaGo在東方圍棋游戲中擊敗世界頂級(jí)玩家的系統(tǒng)。鑒于圍棋游戲的巨大復(fù)雜性，許多專家曾認(rèn)為這種突破不會(huì)這么早實(shí)現(xiàn)，而是起碼將在未來十年內(nèi)完成。