騰訊AI翻譯博鰲論壇出錯求助人工?真相在此
昨天上午,“騰訊同傳”參與了2018博鰲亞洲論壇分論壇“未來的生產(chǎn)”的現(xiàn)場中英雙語翻譯,這是已創(chuàng)辦17年的博鰲亞洲論壇,首次嘗試在開幕式及部分論壇現(xiàn)場使用AI同傳翻譯技術(shù)。
意外的是,僅僅第一天,就有傳言稱“騰訊同傳”出現(xiàn)翻譯錯誤,不得不求助于人工同傳的消息,還貼出了截圖。
對此,騰訊官方辟謠稱,這是個烏龍事件,外界提及的邀請人工同傳,并非“騰訊同傳”團(tuán)隊(duì)用于此次海南博鰲的現(xiàn)場AI同傳,而是用于服務(wù)騰訊新聞團(tuán)隊(duì)北京直播間的專業(yè)報(bào)道。
騰訊承認(rèn),面對博鰲亞洲論壇復(fù)雜的語言環(huán)境和高大上的專業(yè)內(nèi)容,“騰訊同傳”確實(shí)出現(xiàn)了錯誤,答錯了幾道題。
首先是以下流傳最廣的小程序截圖,官方稱之為“大面積單詞無意義重復(fù)、大小寫及字符混亂”現(xiàn)象。
出現(xiàn)這個問題,主要是中英雙語切換頻率的問題。當(dāng)聲源在兩種語言之間不斷轉(zhuǎn)換時(shí),后臺中、英文識別引擎就會同時(shí)開始工作,這會導(dǎo)致兩種識別引擎互相“掐架”,而翻譯結(jié)果卻只能選擇一種語言進(jìn)行輸出,再加上對嘉賓每個語氣詞也做了精準(zhǔn)的啊啊啊翻譯,導(dǎo)致引發(fā)錯誤。
另一個需要承認(rèn)的錯誤是下圖中出現(xiàn)的“for for for × n”現(xiàn)象。
出現(xiàn)這種情況主要是包括神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯在內(nèi)的深度學(xué)習(xí)算法,在原理上或多或少都有一定不確定性,在特定的情況下有一定的概率引發(fā)翻譯偏差。今天的嘉賓演講內(nèi)容中包含“for for for for”、 ”that’s that’s that”等重復(fù)內(nèi)容,而翻譯引擎不巧放大了這個重復(fù),導(dǎo)致了翻譯結(jié)果出現(xiàn)錯誤。
騰訊表示,作為創(chuàng)新孵化和落地的AI產(chǎn)品,“騰訊同傳”還在不斷學(xué)習(xí)和成長當(dāng)中,但是不足就是不足,不足的地方就要繼續(xù)加強(qiáng)學(xué)習(xí)。我們沒有殺一個程序員,也沒有砸一臺服務(wù)器祭天,這次做錯了題,我們會繼續(xù)學(xué)習(xí)提升。