7月12日消息,據媒體報道,微軟公司近期成功研發(fā)了一款名為VALL-E2的革命性AI語音生成技術,該技術的問世標志著AI語音合成領域的一個重大突破。僅需短短三秒鐘的音頻樣本,VALL-E2便能以前所未有的精確度與自然度,復現(xiàn)出說話者的獨特聲線,其表現(xiàn)幾乎達到了以假亂真的人類水準。
科學家表示,這是AI語音首次達到人類水平,由于太過危險,無法向公眾發(fā)布。
與此同時,VALL-E2技術的快速發(fā)展也對傳統(tǒng)聲音演員行業(yè)構成了挑戰(zhàn)。聲音演員們擔心,隨著AI語音合成技術的日益成熟,他們的聲音可能被輕易復制并用于各種場合,而他們所應得的經濟補償卻難以得到合理保障,這無疑對他們的職業(yè)生涯構成了潛在威脅。
盡管VALL-E2 AI語音生成器不會對公眾開放,但也證明了AI在這方面的技術進步,以及未來在合適的時候可以應用,包括教育學習、娛樂、新聞、聊天機器人等。