京東AI女主播 “小可”正式出道:嬌俏可愛(ài) 段子頻出
“大家好,我是京東數(shù)科自研的AI主播小可……地球不爆炸,我就不下班;宇宙不重啟,我就不休息。”
繼京東數(shù)科自研的首位AI虛擬數(shù)字人產(chǎn)品AI主播“小妮”上線后,京東數(shù)科第二位國(guó)風(fēng)AI主播“小可”在端午正式出道,不僅扮相嬌俏可愛(ài),還段子頻出,與靈動(dòng)的真實(shí)主播并無(wú)二致。
為了研發(fā)出寫(xiě)實(shí)逼真的AI虛擬數(shù)字人,京東數(shù)科AI實(shí)驗(yàn)室在文字轉(zhuǎn)語(yǔ)音、3D人臉建模、語(yǔ)音轉(zhuǎn)視頻等方面進(jìn)行了一系列技術(shù)創(chuàng)新。僅需使用一段幾分鐘的人物視頻數(shù)據(jù),經(jīng)過(guò)幾小時(shí)訓(xùn)練就可以合成出寫(xiě)實(shí)風(fēng)格的AI虛擬數(shù)字人。
京東數(shù)科自研輕量級(jí)對(duì)抗語(yǔ)音合成技術(shù),通過(guò)結(jié)合深度神經(jīng)網(wǎng)絡(luò)在多人數(shù)據(jù)上進(jìn)行個(gè)性化建模,達(dá)到音色豐富、特色鮮明的語(yǔ)音合成效果,甚至可以模擬人的呼吸和停頓,聽(tīng)感酷似真人。
小可能夠模仿不同人的說(shuō)話習(xí)慣,學(xué)到如何用點(diǎn)頭、眨眼這些細(xì)微動(dòng)作對(duì)發(fā)言中的重要內(nèi)容加以強(qiáng)調(diào)。
在AI算法的驅(qū)動(dòng)下,只需輸入文本內(nèi)容,小可就能根據(jù)語(yǔ)義實(shí)時(shí)進(jìn)行主持,且表情、動(dòng)作和語(yǔ)音表達(dá)非常自然逼真。
視頻:點(diǎn)此。