當前位置:首頁 > 芯聞號 > 充電吧
[導(dǎo)讀]5月8日消息,近期,Google翻譯悄然升級了其翻譯內(nèi)核。據(jù)Google官方提供的數(shù)據(jù)顯示,Google翻譯搭載的Google的神經(jīng)機器翻譯(GNMT:Google Neural Machine Tr

5月8日消息,近期,Google翻譯悄然升級了其翻譯內(nèi)核。據(jù)Google官方提供的數(shù)據(jù)顯示,Google翻譯搭載的Google的神經(jīng)機器翻譯(GNMT:Google Neural Machine Translation)系統(tǒng)使用了當前最先進的訓(xùn)練技術(shù),因而提升了機器翻譯水平,將翻譯誤差再度降低了55%-85%。

▲Google展示的翻譯模型質(zhì)量

十多年前,Google發(fā)布了Google翻譯,早年基于短語的統(tǒng)計機器翻譯,會將輸入句子分解成詞和短語,然后對它們進行獨立翻譯。這種翻譯方式的劣勢非常明顯:句子中原本完整的信息被碎片化,無法連貫地進行表達。而這種現(xiàn)象在英中互譯的情況下顯得尤其明顯。

而Google神經(jīng)機器翻譯則將輸入的句子作為一個整體翻譯。

以中英翻譯為例,Google神經(jīng)機器翻譯首先將這句中文的詞編碼成一個向量列表,其中每個向量都表示了到目前為止所有被讀取到的詞的含義(編碼器“Encoder”)。讀取完整個句子,解碼器就開始工作——一次生成英語句子的一個詞(解碼器“Decoder”)。

▲上圖展示了Google神經(jīng)機器翻譯的中英翻譯原理

為了在每一步都生成翻譯正確的詞,解碼器重點注意了與生成英語詞最相關(guān)編碼的中文向量的權(quán)重分布。

在被首次提出時,神經(jīng)機器翻譯系統(tǒng)在中等規(guī)模的數(shù)據(jù)集上就與基于短語的翻譯系統(tǒng)水平相當。

現(xiàn)在,Google方面表示,通過讓神經(jīng)機器翻譯戰(zhàn)勝在非常大型的數(shù)據(jù)集上工作的許多挑戰(zhàn),打造了在速度和準確度上都更好翻譯的系統(tǒng)。

目前,Google神經(jīng)機器翻譯系統(tǒng)已投入到了中文-英語的翻譯中?,F(xiàn)在,移動版和網(wǎng)頁版的Google翻譯的中英翻譯已完全使用神經(jīng)機器翻譯——每天大約1800萬條翻譯。

有經(jīng)過大型數(shù)據(jù)集考驗的Google神經(jīng)機器翻譯系統(tǒng)加持,最新的Google翻譯效果究竟如何呢?

我們做了一個簡單的比較測試。當然,還是在中英翻譯場景下。

測試場景:PC端 Google翻譯網(wǎng)頁版

隨機選擇了一則英文消息,原文如下:

Since COVID-19 began, we’ve heard from our retail and brand manufacturing partners that they’re hungry for more insights on how consumer interests are changing, given fluctuations in consumer demand. We see these changes reflected in how people are searching on Google. Last month, there were spikes in search interest for household supplies and jigsaw puzzles as people spent more time at home. This month we’ve seen surging interest for sewing machines and baking materials in the U.S., and tetherball sets and chalk in the United Kingdom and Australia.

Businesses are using a variety of resources to understand changing consumer interests—including Google Trends, social listening, surveys, and their own data—in order to help make decisions on the fly. But if they don’t know what to look for, there isn’t an easy way to understand which product categories are gaining in popularity, and might pose an opportunity.

That’s why we’re launching a rising retail categories tool on Think with Google. It surfaces fast-growing, product-related categories in Google Search, the locations where they’re growing, and the queries associated with them. This is the first time we’ve provided this type of insight on the product categories that people are searching for.

舊版Google翻譯給出的英譯中結(jié)果:

升級后Google翻譯給出的英譯中新結(jié)果,紅色標記字部分為與舊翻譯結(jié)果的不同地方。新版翻譯具體如下:

對比兩段翻譯結(jié)果,可以看出區(qū)別還挺大的。整體而言,新版翻譯結(jié)果中標紅文字的表述明顯更符合漢語的語法和表述習慣。

另外,最后一段的翻譯結(jié)果優(yōu)化則更為明顯,對Google產(chǎn)品名稱“Think with Google”進行了準確識別,避免了亂翻譯的尷尬。

確實更智能啦!

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉