機(jī)器人要瘋,挑戰(zhàn)完記者又來(lái)挑戰(zhàn)解說(shuō)員
如何不再忍受一個(gè)你不喜歡的球賽解說(shuō)員?除了換臺(tái)和靜音,現(xiàn)在有了新的方式——用機(jī)器淘汰他。
比起人來(lái)說(shuō),機(jī)器沒(méi)有情感偏向,幾乎不會(huì)出現(xiàn)低級(jí)錯(cuò)誤,比如把贊助商sharp當(dāng)作球員名字進(jìn)行介紹,也不會(huì)因?yàn)榘盐詹缓霉?jié)奏漏掉關(guān)鍵的比賽細(xì)節(jié),對(duì)于歷史數(shù)據(jù)和信息,甚至沒(méi)有人能擊敗它,因?yàn)樗鶕碛械氖菬o(wú)限的資料庫(kù)和迅速搜索分析的能力,而人只能憑借大腦和記憶。
用機(jī)器實(shí)時(shí)解說(shuō)比賽,這是人工智能和機(jī)器學(xué)習(xí)的場(chǎng)景性應(yīng)用之一。在這個(gè)過(guò)程中可以訓(xùn)練機(jī)器對(duì)于實(shí)時(shí)場(chǎng)景信息的處理、分析、解讀和判斷能力。而且如果對(duì)于一場(chǎng)高速進(jìn)行的球賽都能實(shí)時(shí)解說(shuō),那這種機(jī)器的模型和能力就還能應(yīng)用到更多場(chǎng)景和情況中。
百度版“人機(jī)大戰(zhàn)”
出于上述考慮,百度度秘研發(fā)團(tuán)隊(duì)正在訓(xùn)練旗下人工智能機(jī)器人助理——度秘,解說(shuō)奧運(yùn)男子籃球賽,而且為了讓這種解說(shuō)更富挑戰(zhàn)性和交互性,度秘團(tuán)隊(duì)請(qǐng)來(lái)了擁有多年籃球解說(shuō)經(jīng)驗(yàn)的楊毅,他將和度秘同場(chǎng)搭檔解說(shuō)。這是百度版的“人機(jī)大戰(zhàn)”。
籃球解說(shuō)員楊毅在解說(shuō)直播間,他的搭檔將是面前的機(jī)器
不同以往,這次別開(kāi)生面的人機(jī)解說(shuō)帶有協(xié)作性質(zhì),但也充滿挑戰(zhàn)意味。機(jī)器和人的差異,可以在賽前、賽中和暫停休息等三個(gè)不同場(chǎng)景中被明顯感受到。
在賽前,對(duì)于兩隊(duì)各自情況和數(shù)據(jù)記錄,度秘表現(xiàn)出了機(jī)器所具備的“博學(xué)性”和準(zhǔn)確性,它準(zhǔn)確調(diào)取了球員信息、歷史對(duì)戰(zhàn)數(shù)據(jù)等。而這部分工作以前往往是人類解說(shuō)員的“功課”,不少解說(shuō)員需要賽前花費(fèi)大量時(shí)間搜索、歸納和整理。
楊毅的解說(shuō)則只能更加偏向人文性和趣味性,帶有較強(qiáng)的主觀感性。比如介紹立陶宛時(shí),他能夠介紹到立陶宛知名的啦啦隊(duì)美女,以及如何在立陶宛叫到一扎啤酒。類似這樣的知識(shí),度秘或許也知道,但它很難主動(dòng)告訴你,除非在個(gè)性化訓(xùn)練和調(diào)校中,它知道你對(duì)這些方面的知識(shí)感興趣——它會(huì)在后臺(tái)通過(guò)“標(biāo)簽”給用戶描繪畫(huà)像。
比賽中,度秘則開(kāi)始展現(xiàn)實(shí)時(shí)解說(shuō)比賽的能力,“誰(shuí),什么狀態(tài),在做什么事情,最后結(jié)果如何”,這些比賽基本要素它能夠表述清楚,現(xiàn)場(chǎng)體驗(yàn)來(lái)看,相當(dāng)于在通過(guò)收音機(jī)觀看比賽。實(shí)際上,圖文版也在同步進(jìn)行中,但完全是機(jī)器自發(fā)的行為,不用再耗費(fèi)任何人力。而此時(shí),楊毅的作用則是帶來(lái)圍繞某個(gè)狀態(tài)和場(chǎng)景延伸開(kāi)去的信息,并且豐富解說(shuō)氛圍。打比方來(lái)說(shuō),楊毅和度秘在整個(gè)比賽過(guò)程中相當(dāng)于在進(jìn)行一場(chǎng)相聲表演:楊毅是插科打諢的捧哏,度秘則是不斷圍繞主線進(jìn)行闡述的逗哏。
而在中場(chǎng)休息時(shí)間,度秘則帶來(lái)總結(jié)分析,比如數(shù)據(jù)統(tǒng)計(jì)方面,或者更加個(gè)性化的數(shù)據(jù)情況,如某個(gè)球員的具體數(shù)據(jù)等。這些數(shù)據(jù)此前依賴于賽會(huì)組織方面的統(tǒng)計(jì),只有賽會(huì)方面統(tǒng)計(jì)完畢才能分發(fā)到解說(shuō)員,但現(xiàn)在,機(jī)器可以在解說(shuō)的同時(shí)完成這部分工作,并在實(shí)時(shí)比賽間隙播報(bào)。如果你是一位“教練”型的觀眾,那通過(guò)機(jī)器帶來(lái)的數(shù)據(jù)能夠更加清晰地掌握比賽走勢(shì)——此前則有賴于解說(shuō)員的個(gè)人風(fēng)格,畢竟不是每一個(gè)解說(shuō)員都愛(ài)在休息時(shí)間用數(shù)據(jù)分析比賽。
此外,如果你是一位愛(ài)聽(tīng)段子的球迷,機(jī)器也能從評(píng)論中抓取有趣的評(píng)論或人氣較高的評(píng)論進(jìn)行“解說(shuō)”。
機(jī)器解說(shuō)的背后原理
從技術(shù)原理的角度來(lái)說(shuō),度秘目前可以實(shí)現(xiàn)的“解說(shuō)”能力主要基于自然語(yǔ)言處理技術(shù)(NLP)。簡(jiǎn)單來(lái)講,這個(gè)處理過(guò)程和技術(shù)大致可以分為:對(duì)需求信息分析理解、獲取基本信息(包括對(duì)文字和圖片的信息的搜集、分析和理解)、實(shí)現(xiàn)智能化輸出和有風(fēng)格的解說(shuō)。
其實(shí)這個(gè)過(guò)程也包含了目前人工智能領(lǐng)域的幾大核心技術(shù):語(yǔ)音識(shí)別、大數(shù)據(jù)計(jì)算和機(jī)器學(xué)習(xí)。
但賽事解說(shuō)的特殊性在于它比語(yǔ)音識(shí)別更加復(fù)雜,也比一般的聊天互動(dòng)需要更高的智能化程度,因?yàn)榻庹f(shuō)需要基于領(lǐng)域知識(shí),面向不同層次、需求的用戶,理解比賽當(dāng)時(shí)的形勢(shì),用自然、流暢、生動(dòng)的人類語(yǔ)言講解出來(lái)。
自動(dòng)解說(shuō)主要從機(jī)器翻譯技術(shù)上找到靈感,基于統(tǒng)計(jì)和機(jī)器學(xué)習(xí)方法,把基本的統(tǒng)計(jì)數(shù)據(jù)翻譯成有趣的人類語(yǔ)言解說(shuō)。為了實(shí)現(xiàn)這種“有趣”和解說(shuō)風(fēng)格,度秘學(xué)習(xí)了NBA和2012倫敦奧運(yùn)會(huì)籃球賽的幾百場(chǎng)比賽文字解說(shuō),不僅講人話,還學(xué)到了風(fēng)趣幽默、表情包的運(yùn)用等。
比如在解說(shuō)某個(gè)球員投籃打框未命中時(shí),度秘的表述是:“XXX上籃,咣當(dāng),仿佛聽(tīng)到打鐵的聲音。”另外,在給大家介紹奧運(yùn)會(huì)籃球比賽三分線和NBA 三分線規(guī)制的不同時(shí),它如此說(shuō)道:“奧運(yùn)會(huì)比賽三分線XX米,NBA三分線XX米,不過(guò)還有一種三分線叫庫(kù)里。”這就是機(jī)器學(xué)習(xí)了人類解說(shuō)資料的結(jié)果。
為什么是籃球解說(shuō)?
對(duì)于此次選擇從籃球比賽解說(shuō)入手的原因,新浪科技也詢問(wèn)了百度大搜索總產(chǎn)品架構(gòu)師景鯤,得到的解答是度秘團(tuán)隊(duì)認(rèn)為籃球比賽場(chǎng)景更加豐富、進(jìn)行速度更快、交互更加頻繁,對(duì)于機(jī)器學(xué)習(xí)和訓(xùn)練更加有挑戰(zhàn),此外,籃球比賽受眾范圍更廣,在國(guó)內(nèi)關(guān)注程度高,可以獲得更多更及時(shí)的用戶反饋。當(dāng)然,另外一個(gè)隱秘的原因是度秘團(tuán)隊(duì)中有不少工程師是籃球愛(ài)好者。
度秘此前單獨(dú)解說(shuō)中美籃球賽
不過(guò),除了籃球比賽,機(jī)器解說(shuō)可能在足球比賽中會(huì)更加受到歡迎。因?yàn)樽闱虮荣悎?chǎng)景要比籃球比賽少,但是涉及的數(shù)據(jù)和知識(shí)又會(huì)更多。所以在數(shù)據(jù)方面,機(jī)器解說(shuō)會(huì)超越任何解說(shuō)員的“活字典”般的記憶;其次是對(duì)于場(chǎng)面的分析,結(jié)合數(shù)據(jù)會(huì)更加有針對(duì)性的分析。
實(shí)際上,這一定程度上也能幫助球隊(duì)教練做決策,比如通過(guò)機(jī)器解說(shuō)掌握的數(shù)據(jù)情況,不斷分析球員狀態(tài)和場(chǎng)面因素,能夠幫助教練實(shí)現(xiàn)及時(shí)調(diào)整。
其實(shí),將科技運(yùn)用于比賽訓(xùn)練和執(zhí)教并不稀奇,目前世界上最為優(yōu)秀的足球教練之一魔力鳥(niǎo)穆里尼奧就一直通過(guò)iPad和應(yīng)用幫助自己分析比賽,及時(shí)作出關(guān)鍵決策和判斷。
不過(guò)對(duì)于度秘團(tuán)隊(duì)來(lái)說(shuō),通過(guò)機(jī)器解說(shuō)球賽的方式訓(xùn)練,目的并不是簡(jiǎn)單代替“解說(shuō)員”,他們希望通過(guò)這樣場(chǎng)景化的機(jī)器學(xué)習(xí)訓(xùn)練,未來(lái)可以將模型和方法應(yīng)用到更多更廣泛的場(chǎng)景中。“比如北京大雨天氣會(huì)造成露面積水,那度秘可以對(duì)各方面信息和數(shù)據(jù)做出綜合判斷和分析,引導(dǎo)避開(kāi)積水路段。”百度多模搜索部總監(jiān)孫雯玉介紹說(shuō)。
當(dāng)然,度秘團(tuán)隊(duì)的“野心”是最終能打造出一款“我的度秘”,它能夠全知全能,給用戶生活、工作提供更多的個(gè)性化幫助,更加便利和智能。但目前來(lái)講,技術(shù)上尚無(wú)法實(shí)現(xiàn)這種“全知全能”,對(duì)于發(fā)布即將滿一周年的度秘,度秘團(tuán)隊(duì)希望在今年內(nèi)推出的2.0版本會(huì)有更多場(chǎng)景化和個(gè)性化上的豐富。
機(jī)器會(huì)讓解說(shuō)員失業(yè)嗎?
如果把機(jī)器解說(shuō)放到更寬泛的人工智能進(jìn)展中來(lái)看,那也可看做是機(jī)器對(duì)于人類活動(dòng)和能力的一種替代。在讓實(shí)時(shí)翻譯員、財(cái)報(bào)編輯和速記等“失業(yè)”后,度秘之類的機(jī)器程序正在讓部分“解說(shuō)員”下崗。
拿目前人工智能業(yè)界的論調(diào)來(lái)說(shuō),這些被替代的工作里,很大一部分是“簡(jiǎn)單的重復(fù)的腦力勞動(dòng)”。相比于工業(yè)革命對(duì)體力勞動(dòng)的解放,目前洶涌而來(lái)的人工智能革命正是奔著解放部分腦力勞動(dòng)去的。
機(jī)器在資料收集和分析方面具備優(yōu)勢(shì)
不過(guò)不必?fù)?dān)心的是,人工智能固然有計(jì)算方面的天然優(yōu)勢(shì),但具體到解說(shuō)這種領(lǐng)域,機(jī)器也肯定不會(huì)完全取代人類。比如機(jī)器再如何學(xué)習(xí)、“吃”了多少解說(shuō)資料,都必然不會(huì)在比賽中靈光乍現(xiàn),脫口而出“他繼承了意大利左后衛(wèi)的光榮傳統(tǒng),這一刻他不是說(shuō)一個(gè)人在戰(zhàn)斗,他不是一個(gè)人!”之類的激情解說(shuō)。
這樣的時(shí)刻有些類似人機(jī)圍棋大戰(zhàn)里,李世石擊敗AlphaGo的那一局中的“神之一手”。歸根結(jié)底,人類所具有的感性和靈感的那部分,機(jī)器尚不能習(xí)得,也無(wú)從學(xué)起。
然而有意思的是,如果完全通過(guò)機(jī)器來(lái)解說(shuō)比賽,那解說(shuō)界再也不用擔(dān)心被批評(píng)“不中立”,也不用在比賽中不斷被球迷吐槽了。不知道這是否意味著在解救一部分不堪忍受糟糕解說(shuō)的球迷的同時(shí),也讓觀看比賽少了吐槽解說(shuō)的樂(lè)趣。
但另一個(gè)更有意思的事情是,如果未來(lái)某天AlphaGo真的要來(lái)中國(guó)挑戰(zhàn)柯潔,那這次就可以實(shí)現(xiàn)雙重人機(jī)大戰(zhàn)了。一方面是機(jī)器和棋手下棋,另一方面是機(jī)器和人在解說(shuō)分析上較勁。
當(dāng)然,這時(shí)的你也能用機(jī)器助手叫個(gè)外賣(mài)小龍蝦之類的。