為了重建巴別塔,Google 最近挺努力的
為了重建巴別塔,讓人類可以更突破語言障礙與全球實現互聯,Google 最近在翻譯方面的更新很努力。
▲ Google Pixel Buds
首先,Google 的無線耳機 Pixel Buds 宣佈,其獨有的翻譯功能,將向全體支援 Google Assistant 的耳機開放。
這意味著,BOSE QuietComfort 35 II、索尼 WH-1000XM3,還有 JBL 一系列支援 Google Assistant 的產品,獲得翻譯這個技能點後,都將在我們的耳邊搖身一變成為翻譯器。
▲ Google Pixel Buds 翻譯功能的語言支援
這個功能支援 40 種語言的實時對話翻譯,帶上耳機後通過耳機撥出 Google Assistant,並對其說「翻譯」就能使用。
國內使用支援 Google Assistant 產品的使用者應該不算多,但使用「Google 翻譯」這個 app 的使用者一定不少。
「Google 翻譯」宣佈從 10 月中旬開始,相機翻譯功能將陸續新增支援 13 種語言,分別為阿拉伯語、泰語、越南語、印地語、孟加拉語、古吉拉特語、卡納達語、馬拉雅拉姆語、馬拉地語、尼泊爾語、旁遮普語、泰米爾語和泰盧固語。
本次更新後,「Google 翻譯」的相機翻譯功能將支援 50 種語言,iOS 和 Android 系統的使用者都可以獲得更新。
「Google 翻譯」背後最大的功臣就是機器學習。相機翻譯中就有兩個步驟需要應用人工智慧。
首先,在相機對準需要翻譯的文字後,Google 翻譯會使用光學字元識別技術,對影象上的字母和字元進行識別。光學字元識別技術是一種將影象上的字母轉換為資料的機器學習系統。
隨後,神經網路機器翻譯系統將識別到的文字,翻譯成目標語言自然發音的詞句。光學字元識別技術和神經網路機器翻譯系統,兩個都是 Google 在人工智慧領域的拿手好菜。
2017 年 3 月底,最新版的 「Google 翻譯」終於在中國大陸可用,然而其實從 2016 年 9 月開始,Google 翻譯的中英互譯就正式啟用了神經網路機器翻譯技術。
今年 6 月 Google 宣佈,在 iOS 以及 Android 的「 Google 翻譯」上加入離線神經網路機器翻譯(NMT,Neural Machine Translation),也就是說,下載了離線的資源包後,在沒有網路的情況下,Google 翻譯不會逐個詞語地生硬翻譯,而是逐漸學習去說人話。
我們還曾讓 Google 翻譯分別在聯網、離線沒有 NMT、離線擁有 NMT 的三種情況,對古詩詞、新聞報道、經典臺詞以及日常用語, ofollow,noindex" target="_blank">進行了多個回合的翻譯能力對比 。
▲ 從左往右分別是:聯網,離線未更新 NMT,離線使用 NMT
比如翻譯 6 月 14 日新華社文章《5 月份主要資料反映中國經濟執行穩健》的第一段:「國家統計局 14 日釋出的資料顯示,5 月份,國民經濟繼續保持總體平穩、穩中向好發展態勢,生產需求基本平穩,就業持續向好。」
- 聯網時的翻譯是:基本沒有語法錯誤。
- 沒有更新 NMT 前的離線翻譯是:逐字翻譯無疑,「14 日」翻譯有誤,語法錯誤明顯。
- 更新 NMT 後的離線翻譯是:「五月份」這個翻譯有誤,離線情況下也有使用句子的方式來翻譯。
得出結論:聯網的 Google 翻譯準確度依然是比較高的;離線情況下,就算加入了 NMT 解決了逐字翻譯的問題,用句子的方式來表達,但依然距離信達雅還有一定的距離。
目前而言,同傳翻譯員的飯碗還是很穩的。加入人工智慧技術多年的「Google 翻譯」,不知道它的翻譯能力,會不會遵守摩爾定律呢?