近年來,人工智能越來越滲透人們的生活。
5月21日,搜狗聯(lián)合新華社推出的全球首個3D AI合成主播“新小微”正式亮相,基于搜狗人工智能核心技術,為全國觀眾帶來最新的兩會新聞資訊報道。
早在2018年,基于搜狗分身技術,搜狗就推出全球首個AI合成主播“新小浩”,已在新華社客戶端上持續(xù)為觀眾服務500多天,先后產(chǎn)出13000多條新聞報道,累計時長超過35000分鐘。
而此次的3D AI合成主播就是搜狗分身最新的突破性成果。較之前的2D AI合成主播,3D“新小微”不僅立體、靈活,可控,還具有同時支持多機位多景深,360°任意角度呈現(xiàn)內(nèi)容等能力,在應用空間上擁有更多的可能性,為新聞節(jié)目多樣化制作和呈現(xiàn)帶來了更多選擇。
據(jù)了解,“新小微”以新華社記者趙琬微為原型,基于超寫實3D數(shù)字人建模、多模態(tài)識別及生成、實時面部動作生成及驅(qū)動、遷移學習等多項人工智能前沿技術,使機器可以基于輸入文本生成逼真度極高的3D數(shù)字人視頻內(nèi)容。
3D AI合成主播結合了原力科技提供的業(yè)界領先的掃描還原、面部肌肉驅(qū)動、表情肢體捕捉等技術,生產(chǎn)出了高度還原真人發(fā)膚、形象逼真的數(shù)字人模型。
同時基于搜狗分身領先的端到端多模態(tài)建模技術,使用語音、圖像、文本、3D肌肉運動數(shù)據(jù)等多模態(tài)信息完成聯(lián)合建模訓練。
在AI算法的驅(qū)動下,只需輸入文本內(nèi)容,“新小微”就能根據(jù)語義實時播報新聞,其表情唇動、肢體動作和語音表達高度契合、自然逼真。
最值得一提的是,搜狗表示,不久的將來,3D AI合成主播還會走出演播廳,支持外景播報和互動采訪,為觀眾帶來最前沿的新聞訊息。