搜狗AI核心技術(shù)“搜狗分身”技術(shù)正式亮相烏鎮(zhèn)
近日,第五屆世界互聯(lián)網(wǎng)大會(huì)在浙江烏鎮(zhèn)拉開(kāi)帷幕,在開(kāi)幕當(dāng)天,搜狗公司CEO王小川、新華社副社長(zhǎng)劉思揚(yáng)、搜狗公司智能語(yǔ)音事業(yè)部總經(jīng)理王硯峰和著名主持人邱浩聯(lián)合帶來(lái)了一場(chǎng)跨界產(chǎn)品發(fā)布會(huì):搜狗與新華社合作開(kāi)發(fā)、全球第一個(gè)“AI合成主播”正式亮相。而隨著“AI合成主播”的發(fā)布,搜狗人工智能的核心技術(shù)“搜狗分身”也終于浮出水面,成為大會(huì)開(kāi)幕日的最大亮點(diǎn)之一。
據(jù)了解,“搜狗分身”技術(shù)可以讓機(jī)器以更逼真自然的形象呈現(xiàn)在用戶(hù)面前,而不是冷冰冰的“機(jī)器人”。 該技術(shù)能通過(guò)人臉關(guān)鍵點(diǎn)檢測(cè)、人臉特征提取、人臉重構(gòu)、唇語(yǔ)識(shí)別、情感遷移等多項(xiàng)前沿技術(shù),并結(jié)合語(yǔ)音、圖像等多模態(tài)信息進(jìn)行聯(lián)合建模訓(xùn)練后,生成與真人無(wú)異的AI分身模型。這項(xiàng)技術(shù)讓機(jī)器首次做到逼真的模擬人類(lèi)說(shuō)話(huà)時(shí)的聲音、嘴唇動(dòng)作和表情,并且將三者自然匹配,與真人幾乎一致。以“AI合成主播”為例,用戶(hù)只需要輸入新聞文本,AI合成主播就能用和真人一樣的聲音進(jìn)行播報(bào),而在播報(bào)的過(guò)程中唇形、面部表情等也能與真人主播完全吻合,效果惟妙惟肖。除此之外,“搜狗分身”技術(shù)還能僅靠少量用戶(hù)真實(shí)音視頻數(shù)據(jù),即可快速定制出高逼真度的分身模型,顯著降低了個(gè)性化定制成本,進(jìn)而幫助人類(lèi)提高信息表達(dá)和傳遞的效率。
據(jù)搜狗公司智能語(yǔ)音事業(yè)部總經(jīng)理王硯峰介紹,“搜狗分身”技術(shù)是搜狗人工智能的核心技術(shù)之一,誕生于搜狗“自然交互+知識(shí)計(jì)算”這一人工智能理念之下。依托“搜狗分身”技術(shù)創(chuàng)新的信息傳播形式,能夠幫助媒體在融媒體轉(zhuǎn)型、新聞時(shí)效性和跨語(yǔ)種傳播能力等方面再上臺(tái)階,增強(qiáng)中國(guó)傳媒業(yè)的國(guó)際影響力和全球競(jìng)爭(zhēng)力。
未來(lái),“搜狗分身”技術(shù)將在娛樂(lè)、醫(yī)療、健康、教育、法律等多個(gè)領(lǐng)域提供個(gè)性化的內(nèi)容,顯著提高社會(huì)生產(chǎn)和服務(wù)效率。在解放行業(yè)生產(chǎn)力的同時(shí),“搜狗分身”技術(shù)給予用戶(hù)更好的個(gè)性化音視頻效果,用AI科技來(lái)切實(shí)的提高人們的生活體驗(yàn)。