1. 程式人生 > >AI同傳最新突破:能預測,低延時,外媒稱媲美人類翻譯

AI同傳最新突破:能預測,低延時,外媒稱媲美人類翻譯

640?wx_fmt=png

本文經AI新媒體量子位(公眾號ID:qbitai)授權轉載,轉載請聯絡出處。

本文約2500字,建議閱讀5分鐘。

本文為你介紹了百度於矽谷宣佈了最新重大突破——一個名為STACL的同傳AI的情況。


同傳AI,剛剛在國內掀起過暴風驟雨。


但現在,百度於矽谷宣佈了最新重大突破——一個名為STACL的同傳AI,論文結果優異,Demo效果驚人。


MIT科技評論、IEEE Spectrum等一眾外媒,還紛紛給出好評,這是2016年百度Deep Speech 2釋出以來,又一項讓技術外媒們如此激動的新進展。


百度自己披露:與現在大多數AI“實時”翻譯系統不同,STACL的特點是能預測

延時可控,能夠在演講者講話後幾秒鐘開始翻譯,並在句子結束後幾秒鐘內完成。


STACL不走“整句說完再翻譯”的路線,甚至還會預測發言者未來幾秒的內容,於是延時更短,更接近人類同傳。


究竟能達到什麼程度?IEEE Spectrum採訪後給出類比:跟聯合國會議裡的人類同傳相媲美。


實際效果果真如此?那突破顯然重大。


Demo展示:翻譯AI會預測


視訊時長13S,建議WIFI條件下觀看


Demo可以看出,百度STACL的翻譯工作延時非常短,與原句只差幾個字。


雖說這個AI目前只是同步翻譯成文字,還沒有合成譯文的語音,但這不是重點。關鍵是,不知道你有沒有注意到,這種“只差幾個字”有多難得。


還沒等“美國總統布什在莫斯科與俄羅斯總統普京在莫斯科會晤。”這句漢語說到莫斯科,自動翻譯的英語已經出現了“meet”,也就是漢語句末的“會晤”。


640?wx_fmt=gif


這個“meet”,是AI從前半句話裡腦補出來的,依據的是美國總統最可能與其他人發生怎樣的活動。


因此,百度這個同傳AI,不用等一句話說完,就能開始翻譯了。


對於翻譯AI來說,預測是一項很罕見的技能。不同語言的語序總有差異,所以,那些沒有預測能力的翻譯AI,通常需要等到人類講完一句話,再開始翻譯。


再舉一個栗子 (下圖) ,從“百度在18年前”這半句裡,AI預測出了百度創立的內容“started a business”。


640?wx_fmt=gif


那麼,科學地講,百度AI的預測效果到底怎麼樣?


衡量翻譯質量,要看BLEU分。


中譯英延後5個字的情況下,比起傳統的整句翻譯AI,百度的BLEU分要低了3.4分。


畢竟是預測,發生錯誤是自然的。而這個差距在百度看來是可以接受的。


比如,百度AI可能從前半句話裡預測出會面順利進行,而事實可能是會面並不順利。翻譯就容易出現失誤。


面對這樣的情況,AI目前並沒有糾錯的能力。


不過,用小小的延時,就可以換取更高的準確度:如從延3個詞到延5個詞。使用者可以根據需求隨意調整。


640?wx_fmt=gif

中英語序相似

而當兩種語言語序相差不多的時候,例如描述戴安娜王妃車禍事件的新聞,STACL和傳統整句翻譯的成績相比,就沒有明顯差異了。


這種預測能力,是哪來的?


答案是一個名叫wait-k的模型,它把預測和翻譯無縫整合到了一起,百度把它和兩個翻譯模型結合起來做了實驗,一個是比較早期的RNN翻譯模型,另一個是Google在2017年推出即大熱的Transformer。


不過,wait-k不僅僅適用於這兩個模型,而是可以用在任何序列對映(sequence-to-sequence)模型上。也就是說,只要有個模型能搞定兩種語言之間的翻譯,加上這個wait-k做一點小改造,就能實現同傳了。


一個機器翻譯系統,離不開分析輸入語言的編碼器和輸出目標語言的解碼器,而wait-k對機器翻譯模型所做的小改動,就在解碼器上。它讓解碼器在輸出內容的同時,能預測編碼器還沒有輸入的東西。


百度用這樣一個公式描述了這種解碼策略:


640?wx_fmt=png


其中,x代表輸入的內容,y代表輸出,t代表時間步,而k表示的是解碼器比編碼器搶跑的詞數。


技術細節在論文STACL: Simultaneous Translation with Integrated Anticipation and Controllable Latency中有詳細的介紹。


640?wx_fmt=png


地址:

https://arxiv.org/abs/1810.08398


團隊介紹


640?wx_fmt=jpeg


By the way,按署名次序,介紹一下9位論文作者。


Mingbo Ma,百度矽谷AI實驗室科學家,擁有三個學校的計算機博士學位,今年8月剛從俄勒岡州立大學博士畢業,另外兩個學位在美國東北大學和紐約城市大學,本科畢業於吉林大學,此前曾在蘋果和IBM實習。


黃亮,俄勒岡州立大學助理教授,百度美研首席科學家,此前曾就職於IBM和谷歌,並在紐約城市大學、南加州大學擔任過助理教授,博士畢業於賓夕法尼亞大學。


Hao Xiong,愛丁堡大學計算機碩士,本科畢業於河海大學,2015年加入百度任軟體工程師,負責大容量資料處理系統和資源排程系統。


Kaibo Liu,俄勒岡州立大學助理研究員,今年6月剛到百度實習,本科畢業於北大。


Chuanqiang Zhang,低調的百度技術員工,目前無更多資料。


何中軍,百度主任架構師,從事機器翻譯研究與開發十餘年,多篇論文發表在本領域權威國際會議ACL、EMNLP、COLING、AAAI等,參與專案曾獲2015年度國家科學技術進步獎二等獎。


Hairong Liu,百度矽谷AI實驗室科學家,曾就職於三星和普渡大學,華中科大電子電氣博士。


Xing Li,中科院自然語言處理和機器學習碩士,百度矽谷人工智慧實驗室的高階經理,曾任英特爾技術leader,在百度擔任過技術工程經理,領導百度貼吧研發團隊。


王海峰,百度高階副總裁,e-Staff,百度AIG負責人、百度研究院院長,哈工大計算機博士。


640?wx_fmt=jpeg

王海峰

第一波評價


百度這次技術突破宣佈後,首先在外媒引發報道。


有好評。其中評價最高的是IEEE Spectrum,認為百度開發的這個新系統,揭示了一種通過預測未來而保持穩定的翻譯工具,可以與聯合國會議期間提供同傳服務的口譯人員相媲美,讓人們離軟體巴別魚又近了一步。


有對比。比如將百度的這次突破與谷歌聯絡起來。南華早報評論:隨著百度新的翻譯系統亮相,百度向谷歌發起了挑戰。


還有將百度和谷歌放一起當“耦合”的。Engadget觀點:


雖然這個系統仍舊有侷限性,而且無法在必要的時候取代人類翻譯。但是它在谷歌缺席中國的情況下,給出了一種新的選擇。


SiliconANGLE則援引分析師評論稱:“亞洲的語言翻譯方面仍然存在一定的侷限性,看到本地的玩家加入到這個遊戲中來,的確是一件好事。”


但目前最多的態度是觀望。


在技術宅密度比較高的Hacker News和Reddit上,百度的這條訊息,並沒有引發太多的討論。


截至早上7點40分,Reddit只有一條評論,Hacker News上有兩條評論——雖然這個訊息釋出已有5個多小時。


Reddit上面的一條評論有點“水”,只是說這個Demo很好。


640?wx_fmt=png


Hacker News的兩條評論中,一條比較有技術含量,提出瞭如何翻譯德語的問題,並給出了一些示例,另一條是說,這個Demo很好。


640?wx_fmt=png


比較有趣的是,兩個說這個Demo很好的網友,暱稱基本上是一樣的。


不過這個技術到底好不好,更多中外關注者馬上都能給出判斷。


因為百度最快會在下週的年度技術大會上,進行公開展示。


究竟是重大突破,抑或還只是完美Demo,到時一看便知。


當然,有科研實力有技術復現的同學,現在就能去試試了。


歡迎反饋你的測後評價~


— 完 —


640?wx_fmt=png640?wx_fmt=jpeg