當(dāng)前位置:首頁 > 芯聞號(hào) > 充電吧
[導(dǎo)讀]昨日,騰訊AILab與王者榮耀共同探索的前沿研究項(xiàng)目-策略協(xié)作型AI“絕悟”在吉隆坡舉辦的王者榮耀最高規(guī)格電競(jìng)賽事—;—;世界冠軍杯半決賽的特設(shè)環(huán)節(jié)中,在職業(yè)選手賽區(qū)聯(lián)隊(duì)帶來的5v5水平測(cè)試中獲勝,升

昨日,騰訊AILab與王者榮耀共同探索的前沿研究項(xiàng)目-策略協(xié)作型AI“絕悟”在吉隆坡舉辦的王者榮耀最高規(guī)格電競(jìng)賽事—;—;世界冠軍杯半決賽的特設(shè)環(huán)節(jié)中,在職業(yè)選手賽區(qū)聯(lián)隊(duì)帶來的5v5水平測(cè)試中獲勝,升級(jí)至王者榮耀電競(jìng)職業(yè)水平。

而就在同一天,“絕悟”的1v1版本也在上海舉辦的國際數(shù)碼互動(dòng)娛樂展覽會(huì)ChinaJoy首次對(duì)公眾亮相,向頂級(jí)業(yè)余玩家開放為期四天的體驗(yàn)測(cè)試。其中在首日的504場(chǎng)測(cè)試中,“絕悟”的測(cè)試勝率為99.8%,僅有1場(chǎng)輸給了王者榮耀國服第一后羿。

據(jù)悉,“絕悟”名字寓意絕佳領(lǐng)悟力,其技術(shù)研發(fā)始于2017年12月,并在2018年12月通過了由前職業(yè)選手與主播聯(lián)隊(duì)帶來的頂尖業(yè)余水平測(cè)試。

“絕悟”在游戲測(cè)試中的對(duì)戰(zhàn)實(shí)況

此次測(cè)試的“絕悟”版本建立了基于“觀察-行動(dòng)-獎(jiǎng)勵(lì)”的深度強(qiáng)化學(xué)習(xí)模型,無需人類數(shù)據(jù),從白板學(xué)習(xí)(TabulaRasa)開始,讓AI自己與自己對(duì)戰(zhàn),一天的訓(xùn)練強(qiáng)度抵得上人類440年。AI從0到1摸索成功經(jīng)驗(yàn),勤學(xué)苦練,既學(xué)會(huì)了如何站位、打野、輔助保護(hù)和躲避傷害等游戲常識(shí)。

而更令人驚喜的是,AI也探索出了不同于人類常規(guī)做法的全新策略。團(tuán)隊(duì)還創(chuàng)建OneModel模型提升訓(xùn)練效率,優(yōu)化通信效率提升AI的團(tuán)隊(duì)協(xié)作能力,使用零和獎(jiǎng)懲機(jī)制讓AI能最大化團(tuán)隊(duì)利益,使其打法果斷,有舍有得。

探索全新策略:開局時(shí)“絕悟”沒選擇傳統(tǒng)人類對(duì)線走位策略,而是由雙C位英雄虞姬和王昭君先一起清理中路第一波兵線,壓制敵方中輔。之后又轉(zhuǎn)上路壓制曹操血線。

長(zhǎng)線策略:對(duì)線期,賽區(qū)聯(lián)隊(duì)三人壓迫下路,“絕悟”果斷選擇用三個(gè)AI反壓賽區(qū)聯(lián)隊(duì)的上路,最終雙方互換一塔,維持均勢(shì)。

團(tuán)隊(duì)協(xié)作:比賽中期,“絕悟”四人追擊娜可露露,AI達(dá)摩一腳將娜可露露反踢入AI群中,再由四個(gè)AI完美配合拿下自己的首殺。

即時(shí)策略:一對(duì)一時(shí),賽區(qū)聯(lián)隊(duì)實(shí)力較強(qiáng)的曹操追擊“絕悟”虞姬,虞姬在殘血狀態(tài)退至高地??吹讲懿倏顾看鬁p后,把握機(jī)會(huì)絕地反殺。

即時(shí)策略+團(tuán)隊(duì)協(xié)作:比賽后期在賽區(qū)聯(lián)隊(duì)的上路高地塔團(tuán)戰(zhàn),AI王昭君先手被對(duì)方秒殺,“絕悟”果斷選擇反打,以漂亮的一波團(tuán)戰(zhàn)全殲對(duì)手。

即時(shí)策略+團(tuán)隊(duì)協(xié)作:在賽區(qū)聯(lián)隊(duì)全隊(duì)覆滅后,“絕悟”的兵線尚未到達(dá),下路高地塔還有過半血量,“絕悟”果斷選擇四人輪流抗塔,無兵線強(qiáng)拆塔。注:賽事尾聲,賽區(qū)聯(lián)隊(duì)團(tuán)滅后,“絕悟”未直接推水晶,而是計(jì)算整體收益后,選擇先推最后一個(gè)高地塔,再推水晶直至勝利。

“絕悟”面臨的技術(shù)難點(diǎn)

游戲中測(cè)試的難點(diǎn),是AI要在不完全信息、高度復(fù)雜度的情況作出復(fù)雜快速的決策。在龐大且信息不完備的地圖上,10位參與者要在策略規(guī)劃、英雄選擇、技能應(yīng)用、路徑探索及團(tuán)隊(duì)協(xié)作上面臨大量、不間斷、即時(shí)的選擇,這帶來了極為復(fù)雜的局面,預(yù)計(jì)有高達(dá)10的20000次方種操作可能性,而整個(gè)宇宙原子總數(shù)也只是10的80次方。

若AI能在如此復(fù)雜的環(huán)境中,學(xué)會(huì)人一樣實(shí)時(shí)感知、分析、理解、推理、決策到行動(dòng),就可能在多變、復(fù)雜的真實(shí)環(huán)境中發(fā)揮更大作用。因此業(yè)界認(rèn)為下一個(gè)AI里程碑,可能會(huì)在復(fù)雜策略游戲中誕生。世界頂級(jí)科技公司均在推進(jìn)此類研究,如GoogleDeepmind(星際爭(zhēng)霸2)、Facebook(星際爭(zhēng)霸2)及OpenAI(Dota2)等。

關(guān)于“絕悟”更多技術(shù)細(xì)節(jié)解讀,騰訊AILab表示將通過論文等形式進(jìn)一步分享,并通過開放研究,幫助和啟發(fā)更多研究者。

騰訊AILab在智能體研究中取得的進(jìn)展

騰訊AILab一直是此類智能體研究的先行者。2016年起,研發(fā)的圍棋AI“絕藝”(FineArt),現(xiàn)擔(dān)任中國國家圍棋隊(duì)訓(xùn)練專用AI;2017年,啟動(dòng)“絕悟”研發(fā);2018年,“絕悟”達(dá)到業(yè)余頂尖水平,騰訊還在射擊類頂級(jí)AI競(jìng)賽VizDoom奪冠,并在《星際爭(zhēng)霸2》首先研發(fā)出擊敗內(nèi)置AI的智能體。

而這兩次技術(shù)水平測(cè)試結(jié)果代表騰訊在深度強(qiáng)化學(xué)習(xí)、多智能體決策智能課題上的國際級(jí)AI研究水準(zhǔn),也標(biāo)志著公司在攻堅(jiān)通用人工智能(ArtificialGeneralIntelligence)難題上更進(jìn)一步。

對(duì)在這兩次技術(shù)水平測(cè)試中所取得的成果,騰訊副總裁姚星介紹,“電子競(jìng)技”將成為策略協(xié)作型AI“絕悟”未來短期內(nèi)的主要應(yīng)用場(chǎng)景。作為數(shù)字時(shí)代最受年輕人歡迎的運(yùn)動(dòng),電競(jìng)已于2018年成為亞運(yùn)會(huì)表演項(xiàng)目,中國隊(duì)參賽獲兩金一銀的佳績(jī)。與傳統(tǒng)體育項(xiàng)目一樣,電競(jìng)職業(yè)選手也需要手眼腦協(xié)調(diào)、策略和操作快速反應(yīng)、團(tuán)隊(duì)協(xié)作精神及大量刻苦訓(xùn)練。借助在算法和數(shù)據(jù)方面的優(yōu)勢(shì),AI可為職業(yè)選手提供數(shù)據(jù)、戰(zhàn)略與協(xié)作類實(shí)時(shí)分析與建議,及不同強(qiáng)度與級(jí)別的專業(yè)陪練。以前沿科技推動(dòng)電競(jìng)專業(yè)化發(fā)展,AI將繼續(xù)推動(dòng)中國電競(jìng)在全球范圍內(nèi)保持領(lǐng)先。

而長(zhǎng)期應(yīng)用上,“絕悟”將是騰訊攻克AI終極研究難題—;—;通用人工智能的關(guān)鍵一步。AGI代表研發(fā)能在通用系統(tǒng)中執(zhí)行多種復(fù)雜命令,達(dá)到或超越人類水平的AI,從“絕藝”到“絕悟”,不斷讓AI從0到1去學(xué)習(xí)進(jìn)化,并發(fā)展出一套合理的行為模式,這中間的經(jīng)驗(yàn)、方法與結(jié)論,長(zhǎng)期來看,有望在大范圍內(nèi),如醫(yī)療、制造、無人駕駛、農(nóng)業(yè)到智慧城市管理等領(lǐng)域帶來更深遠(yuǎn)影響。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉