新華社AI合成主播引關(guān)注,外媒:你們怕是對AI有什么誤解?
如果有一天,為你播報(bào)新聞的不是真人,而是和真人像得不得了的AI合成主播,你覺得怎么樣呢?
日前,新華社聯(lián)合搜狗(Sogou)近日在烏鎮(zhèn)舉辦的第五屆世界互聯(lián)網(wǎng)大會上發(fā)布全球首個(gè)合成新聞主播——“AI合成主播” ,無論是臉部表情、聲線都以AI人工智能合成??催^的人不禁驚呼:“主播們要失業(yè)了嗎?”
和過去AI人物多以3D立體動畫出現(xiàn)的方式不同,該技術(shù)采用人臉關(guān)鍵點(diǎn)檢測、人臉特征提取、人臉重構(gòu)、唇語識別、情感遷移等多項(xiàng)尖端技術(shù),并結(jié)合語音、圖像等多模態(tài)信息進(jìn)行聯(lián)合建模訓(xùn)練,所生成與真人無異的人工智能分身,和真人主播在某些方面難分軒輊,“看起來不只是一臺冷冰冰的機(jī)器人”。
其中,中文AI合成主播是按照新華社當(dāng)家主播邱浩為原型,只見它戴著紅領(lǐng)帶、穿著條紋西裝,在播報(bào)時(shí)不只有抑揚(yáng)頓挫,還會搭配點(diǎn)頭、眨眼和抬高眉毛等小動作來強(qiáng)調(diào)播報(bào)內(nèi)容。
新華社指,此技術(shù)可把輸入的中文、英文新聞內(nèi)容,自動生成相關(guān)內(nèi)容的影片,展現(xiàn)出與真人主播無異的信息傳達(dá)效果。
新華社形容這個(gè)AI合成主播是開了“外掛”,因?yàn)檎嫒酥鞑ッ刻旃ぷ?小時(shí),而這個(gè)“分身”卻能不知疲倦地工作24小時(shí)。這個(gè)AI新聞主播可提升電視新聞的制作效率、降低制作成本,也可在報(bào)道突發(fā)新聞當(dāng)中快速生成影片,提高報(bào)道時(shí)效與質(zhì)量。
但 The Verge 觀察表示,目前還不清楚究竟是采用什么技術(shù),但不外乎有機(jī)器學(xué)習(xí)技術(shù)。而看來新華社使用人類主播的連續(xù)鏡頭作為基礎(chǔ),然后使用動畫制作口腔和臉部表情變成虛擬人偶,再與合成語音結(jié)合,新華社可以對數(shù)字主播進(jìn)行編碼以閱讀新聞,這比使用傳統(tǒng)的計(jì)算機(jī)生成影像要快得多。
引發(fā)全球媒體關(guān)注
幾天來,全球媒體紛紛予以持續(xù)關(guān)注,路透社、BBC、CNN等數(shù)十家海外權(quán)威媒體以文字、視頻等方式進(jìn)行了大篇幅報(bào)道。
BBC(英國廣播公司)、REUTERS(路透社)的報(bào)道頁面
《參考消息》援引外媒報(bào)道稱,中國的新聞主播可能面臨一些新的競爭——人工智能機(jī)器人在播報(bào)新聞時(shí)可以模仿人的面部表情和舉止。
除此之外,《泰晤士報(bào)》、福克斯新聞、今日俄羅斯電視臺、法蘭西24電視臺、《新聞周刊》、《洛杉磯時(shí)報(bào)》、美國國家公共電臺等媒體也進(jìn)行了報(bào)道。
路透社報(bào)道稱,這個(gè)AI主播是以中國新聞主播邱浩為原型的,它身穿黑西裝打著領(lǐng)帶。這是中國旨在提升其在人工智能技術(shù)方面能力努力的一部分。
CNN(美國有線電視新聞網(wǎng))、英國《衛(wèi)報(bào)》的報(bào)道頁面
英國《媒體》網(wǎng)站則稱,新華社的AI主播是一位栩栩如生的數(shù)字化播報(bào)員,可以通過模仿真人主播的形象和聲音朗讀文本內(nèi)容。
在受到贊許的同時(shí),有些媒體認(rèn)為“AI合成主播”還需要進(jìn)一步完善。美國《赫芬頓郵報(bào)》網(wǎng)站稱,新華社似乎知道AI主播是需要不斷完善的,正如AI主播在其首次播報(bào)中所強(qiáng)調(diào)的那樣。它說:“作為一名正在研發(fā)中的人工智能新聞主播,我知道我需要改進(jìn)的還有很多。謝謝。”
美國《華盛頓郵報(bào)》、美國《赫芬頓郵報(bào)》關(guān)于“AI合成主播”的相關(guān)報(bào)道
創(chuàng)新驅(qū)動媒體行業(yè)發(fā)展
目前,“AI合成主播”已經(jīng)在新華社正式上崗,已被運(yùn)用到進(jìn)博會、世界互聯(lián)網(wǎng)大會等重要新聞事件,以及突發(fā)、科技、社會、文化等各領(lǐng)域的新聞報(bào)道。“AI合成主播”視頻在新華社中英文客戶端、新華社微信公眾號、中國新華新聞電視網(wǎng)(CNC)、新華視點(diǎn)微博、新華社中國網(wǎng)事微博、新華社“微悅讀”小程序等平臺上播發(fā)后,引發(fā)網(wǎng)友持續(xù)關(guān)注。
尤其是結(jié)合新華社客戶端“現(xiàn)場新聞”報(bào)道,將“AI合成主播”與短視頻一體化生產(chǎn)制作,呈現(xiàn)了令人耳目一新的新聞短視頻。
民眾:有點(diǎn)恐怖,看久了很枯燥
技術(shù)的開發(fā)者搜狗公司表示,這樣的科技還可以因應(yīng)不同產(chǎn)業(yè)的客戶需求,為它們量身打造產(chǎn)品。搜狗公司CEO王小川提到,他們可以拿著這一套AI系統(tǒng)去和有聲書app“凱叔講故事”談合作,“以前是凱叔去講故事,以后可能就會變成你的爸爸媽媽給你講故事。在我們大的理念下,主播是其中一塊,之后要把它個(gè)性化,變成其他的人”。
至于民眾對新華社和搜狗推出的AI合成主播買不買單呢?許多網(wǎng)友不約而同都提到有點(diǎn)可怕。
英國牛津大學(xué)計(jì)算機(jī)科學(xué)教授伍爾德里吉(Michael Wooldridge)表示,AI合成主播的出現(xiàn)讓他想到了著名的“恐怖谷理論”(uncanny valley)。
恐怖谷理論是 1970年,由日本機(jī)器人專家森政弘(Masahiro Mori)提出的概念,他指出當(dāng)機(jī)器人或動畫的外型跟人類相像到特定程度時(shí),人們在心理上會出現(xiàn)非常不舒服的感受,哪怕它們與人類只有一點(diǎn)點(diǎn)的差別,都會顯得非常刺眼。
伍爾德里吉教授說:“要(讓我)多看AI合成主播幾分鐘很困難,它的播報(bào)非常平、非常單一,這之中沒有節(jié)奏、拍子或重點(diǎn)。”
伍爾德里吉教授也提到,主播這個(gè)角色在不少人心中算是值得高度信賴的公眾人物,“如果你只看合成影像,那么你會完全失去和主播間的連結(jié)”。
英國謝菲爾德大學(xué)AI和機(jī)器人學(xué)榮譽(yù)教授夏基(Noel Sharkey)則說,中國AI合成主播的出現(xiàn)是很好的嘗試,他說:“我們會看著它隨著時(shí)間進(jìn)步,問題在它可能非??菰?。”
外媒專家:你們怕是對AI有什么誤解?
MIT Technology Review 的高級編輯 Will Knight 表示,在這個(gè)情況下使用“人工智能”做描述有點(diǎn)不實(shí),因?yàn)閳?bào)導(dǎo)員本身并不擁有智慧,而只是利用了某種機(jī)器學(xué)習(xí)來捕捉真正報(bào)導(dǎo)員的動作和聲音,透過虛擬報(bào)導(dǎo)員的影像來表達(dá)真人預(yù)備的新聞內(nèi)容。
他認(rèn)為,如果連報(bào)導(dǎo)內(nèi)容都是由人工智能編寫,包括數(shù)據(jù)搜集甚至打電話進(jìn)行采訪等,則會是相當(dāng)震撼的技術(shù),不過目前仍然在技術(shù)上難以做到。Will 說,人們在使用“人工智能”一詞時(shí)應(yīng)該相當(dāng)謹(jǐn)慎,例如這次報(bào)導(dǎo)員并不是人工智能,只是個(gè)相當(dāng)細(xì)致的虛擬形像。
倫敦帝國大學(xué)的機(jī)器及人工智能研究人員 Ali Shafti 也表示,向大眾介紹人工智能和機(jī)器人技術(shù)的時(shí)候,要特別小心,因?yàn)榇蟊妼τ谶@些科技都有一定的恐懼和負(fù)面想法,因此正確地解釋技術(shù)而非夸大其詞相當(dāng)重要。