1. 程式人生 > >微軟人工智慧又一里程碑:微軟中-英機器翻譯水平可“與人類媲美”

微軟人工智慧又一里程碑:微軟中-英機器翻譯水平可“與人類媲美”

640?wxfrom=5&wx_lazy=1

編者按:今天,微軟研究團隊宣佈其研發的機器翻譯系統在通用新聞報道測試集newstest2017的中-英測試集上達到了人類水平。這個系統模型包含了由微軟亞洲研究院研發的對偶學習、推敲網路、聯合訓練和一致性規範技術。機器翻譯是自然語言處理領域最具挑戰性的研究任務之一,我們相信新技術的應用會讓機器翻譯的結果日臻完善,並且催生更多人工智慧技術應用的突破。文末點選閱讀原文下載完整論文。

繼在語音識別機器閱讀領域取得的“過人”成績,由微軟亞洲研究院與雷德蒙研究院的研究人員組成的團隊今天宣佈,其研發的機器翻譯系統在通用新聞報道測試集newstest2017的中-英測試集上,達到了可與人工翻譯媲美的水平。這是首個在新聞報道的翻譯質量和準確率上可以比肩人工翻譯的翻譯系統

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

newstest2017新聞報道測試集由產業界和學術界的合作伙伴共同開發,並於去年秋天在WMT17大會上釋出。為了確保翻譯結果準確且達到人類的翻譯水平,微軟研究團隊邀請了雙語語言顧問將微軟的翻譯結果與兩個獨立的人工翻譯結果進行了比較評估。

微軟技術院士,負責微軟語音、自然語言和機器翻譯工作的黃學東稱,這是對自然語言處理領域最具挑戰性任務的一項重大突破。“在機器翻譯方面達到與人類相同的水平是所有人的夢想,我們沒有想到這麼快就能實現。”他表示,“消除語言障礙,幫助人們更好地溝通,這非常有意義,值得我們多年來為此付出的努力。”

640?wx_fmt=jpeg微軟技術院士黃學東

機器翻譯是科研人員攻堅了數十年的研究領域,曾經很多人都認為機器翻譯根本不可能達到人類翻譯的水平。雖然此次突破意義非凡,但

研究人員也提醒大家,這並不代表人類已經完全解決了機器翻譯的問題,只能說明我們離終極目標又更近了一步微軟亞洲研究院副院長、自然語言計算組負責人周明表示,在WMT17測試集上的翻譯結果達到人類水平很鼓舞人心,但仍有很多挑戰需要我們解決,比如在實時的新聞報道上測試系統等。

微軟機器翻譯團隊研究經理Arul Menezes表示,團隊想要證明的是:當一種語言對(比如中-英)擁有較多的訓練資料,且測試集中包含的是常見的大眾類新聞詞彙時,那麼在人工智慧技術的加持下機器翻譯系統的表現可以與人類媲美。

640?wx_fmt=jpeg

微軟機器翻譯團隊研究經理Arul Menezes

640.png?

跨時區

跨領域合作,四大技術為創新加持

雖然學術界和產業界的科研人員致力於機器翻譯研究很多年,但近兩年深度神經網路的使用讓機器翻譯的表現取得了很多實質性突破,翻譯結果相較於以往的統計機器翻譯結果更加自然流暢。為了能夠取得中-英翻譯的里程碑式突破,

來自微軟亞洲研究院和雷德蒙研究院的三個研究組,進行了跨越中美時區、跨越研究領域的聯合創新

其中,微軟亞洲研究院機器學習組將他們的最新研究成果——對偶學習(Dual Learning)和推敲網路(Deliberation Networks)應用在了此次取得突破的機器翻譯系統中微軟亞洲研究院副院長、機器學習組負責人劉鐵巖介紹道,“這兩個技術的研究靈感其實都來自於我們人類的做事方式。”對偶學習利用的是人工智慧任務的天然對稱性。當我們將其應用在機器翻譯上時,效果就好像是通過自動校對來進行學習——當我們把訓練集中的一箇中文句子翻譯成英文之後,系統會將相應的英文結果再翻譯回中文,並與原始的中文句子進行比對,進而從這個比對結果中學習有用的反饋資訊,對機器翻譯模型進行修正。而推敲網路則類似於人們寫文章時不斷推敲、修改的過程。通過多輪翻譯,不斷地檢查、完善翻譯的結果,從而使翻譯的質量得到大幅提升。對偶學習和推敲網路的工作發表在NIPS、ICML、AAAI、IJCAI等人工智慧的全球頂級會議上,並且已被其他學者推廣到機器翻譯以外的研究領域。

640?wx_fmt=jpeg

微軟亞洲研究院副院長、機器學習組負責人劉鐵巖

周明帶領的自然語言計算組多年來一直致力於攻克機器翻譯,這一自然語言處理領域最具挑戰性的研究任務。周明表示,“由於翻譯沒有唯一的標準答案,它更像是一種藝術,因此需要更加複雜的演算法和系統去應對。”自然語言計算組基於之前的研究積累,在此次的系統模型中增加了另外兩項新技術:聯合訓練(Joint Training)和一致性規範(Agreement Regularization),以提高翻譯的準確性。聯合訓練可以理解為用迭代的方式去改進翻譯系統,用中英翻譯的句子對去補充反向翻譯系統的訓練資料集,同樣的過程也可以反向進行。一致性規範則讓翻譯可以從左到右進行,也可以從右到左進行,最終讓兩個過程生成一致的翻譯結果。

640?wx_fmt=jpeg

微軟亞洲研究院副院長、自然語言計算組負責人周明

可以說,兩個研究組分別將各自所在領域的積累與最新發現應用在了此次的機器翻譯系統中,從不同角度切入,讓翻譯質量大幅提升。在專案合作過程中,他們每週都會與雷德蒙總部的團隊開會討論,確保技術可以無縫融合,系統可以快速迭代。

640.png?

沒有

“正確的”翻譯結果

newstest2017新聞報道測試集包括約2000個句子,由專業人員從線上報紙樣本翻譯而來。微軟團隊對測試集進行了多輪評估,每次評估會隨機挑選數百個句子翻譯。為了驗證微軟的機器翻譯是否與人類的翻譯同樣出色,微軟沒有停留在測試集本身的要求,而是從外部聘請了一群雙語語言顧問,將微軟的翻譯結果與人工翻譯進行比較。

驗證過程之複雜也從另一個側面體現了機器翻譯要做到準確所面臨的複雜性。對於語音識別等其它人工智慧任務來說,判斷系統的表現是否可與人類媲美相當簡單,因為理想結果對人和機器來說完全相同,研究人員也將這種任務稱為模式識別任務。

然而,機器翻譯卻是另一種型別的人工智慧任務,即使是兩位專業的翻譯人員對於完全相同的句子也會有略微不同的翻譯,而且兩個人的翻譯都不是錯的。那是因為表達同一個句子的“正確的”方法不止一種。 周明表示:“這也是為什麼機器翻譯比純粹的模式識別任務複雜得多,人們可能用不同的詞語來表達完全相同的意思,但未必能準確判斷哪一個更好。”

複雜性讓機器翻譯成為一個極有挑戰性的問題,但也是一個極有意義的問題。劉鐵巖認為,我們不知道哪一天機器翻譯系統才能在翻譯任何語言、任何型別的文字時,都能在“信、達、雅”等多個維度上達到專業翻譯人員的水準。不過,他對技術的進展表示樂觀,因為每年微軟的研究團隊以及整個學術界都會發明大量的新技術、新模型和新演算法,“我們可以預測的是,新技術的應用一定會讓機器翻譯的結果日臻完善。”

研究團隊還表示,此次技術突破將被應用到微軟的商用多語言翻譯系統產品中,從而幫助其它語言或詞彙更復雜、更專業的文字實現更準確、更地道的翻譯。此外,這些新技術還可以被應用在機器翻譯之外的其他領域,催生更多人工智慧技術和應用的突破

延伸閱讀:

對偶學習(Dual Learning):對偶學習的發現是由於現實中有意義、有實用價值的人工智慧任務往往會成對出現,兩個任務可以互相反饋,從而訓練出更好的深度學習模型。例如,在翻譯領域,我們關心從英文翻譯到中文,也同樣關心從中文翻譯回英文;在語音領域,我們既關心語音識別的問題,也關心語音合成的問題;在影象領域,影象識別與影象生成也是成對出現。此外,在對話引擎、搜尋引擎等場景中都有對偶任務。

一方面,由於存在特殊的對偶結構,兩個任務可以互相提供反饋資訊,而這些反饋資訊可以用來訓練深度學習模型。也就是說,即便沒有人為標註的資料,有了對偶結構也可以做深度學習。另一方面,兩個對偶任務可以互相充當對方的環境,這樣就不必與真實的環境做互動,兩個對偶任務之間的互動就可以產生有效的反饋訊號。因此,充分地利用對偶結構,就有望解決深度學習和增強學習的瓶頸——訓練資料從哪裡來、與環境的互動怎麼持續進行等問題

論文地址:https://papers.nips.cc/paper/6469-dual-learning-for-machine-translation.pdf

640?wx_fmt=png

對偶無監督學習框架

推敲網路(Deliberation Networks)“推敲”二字可以認為是來源於人類閱讀、寫文章以及做其他任務時候的一種行為方式,即任務完成之後,並不當即終止,而是會反覆推敲。微軟亞洲研究院機器學習組將這個過程沿用到了機器學習中。推敲網路具有兩段解碼器,其中第一階段解碼器用於解碼生成原始序列,第二階段解碼器通過推敲的過程打磨和潤色原始語句。後者瞭解全域性資訊,在機器翻譯中看,它可以基於第一階段生成的語句,產生更好的翻譯結果。

論文地址:

https://www.microsoft.com/en-us/research/publication/deliberation-networks-sequence-generation-beyond-one-pass-decoding/

640?wx_fmt=png

推敲網路的解碼過程

聯合訓練(Joint Training):這個方法可以認為是從源語言到目標語言翻譯(Source to Target)的學習與從目標語言到源語言翻譯(Target to Source)的學習的結合。中英翻譯和英中翻譯都使用初始並行資料來訓練,在每次訓練的迭代過程中,中英翻譯系統將中文句子翻譯成英文句子,從而獲得新的句對,而該句對又可以反過來補充到英中翻譯系統的資料集中。同理,這個過程也可以反向進行。這樣雙向融合不僅使得兩個系統的訓練資料集大大增加,而且準確率也大幅提高

論文地址:

https://arxiv.org/pdf/1803.00353.pdf

640?wx_fmt=png

聯合訓練:從源語言到目標語言翻譯(Source to Target)P(y|x) 與從目標語言到源語言翻譯(Target to Source)P(x|y)

一致性規範(Agreement Regularization):翻譯結果可以從左到右按順序產生,也可以從右到左進行生成。該規範對從左到右和從右到左的翻譯結果進行約束。如果這兩個過程生成的翻譯結果一樣,一般而言比結果不一樣的翻譯更加可信。這個約束,應用於神經機器翻譯訓練過程中,以鼓勵系統基於這兩個相反的過程生成一致的翻譯結果。

640?wx_fmt=jpeg

點選閱讀原文,下載最新論文

試用系統:

https://translator.microsoft.com/neural/

微軟翻譯工具Microsoft Translator:

https://www.microsoft.com/en-us/translator/default.aspx

你也許還想

640.png?

感謝你關注“微軟研究院AI頭條”,我們期待你的留言和投稿,共建交流平臺。來稿請寄:[email protected]

640.jpeg?

相關推薦

微軟人工智慧里程碑微軟-機器翻譯水平人類媲美

編者按:今天,微軟研究團隊宣佈其研發的機器翻譯系統在通用新聞報道測試集newstest2017的

人工智慧技術發展史

2018年11月24日星期六 我分六篇文章,大概把我學到的人工智慧課程給大家介紹一下,與君共享。  這六篇文章會從人工智慧的歷史開始講起,然後機器學習的核心方法——SVM的基本知識,再講決策樹的相關知識,最後講近幾年非常受歡迎的深度學習。 人工智慧是利用智慧學習演算法,將大量資

SpringBoot | 第十Springapplication.properties用法大全

對 Spring 裡面的 Properties 不理解的開發者可能會覺得有點亂,主要是因為配置方式很多種,使用方式也很多種。 本文不是原理分析、原始碼分析文章,只是希望可以幫助讀者更好地理解和使用 Spring Properties。 Properties 的使用 先來看看 Prop

劍指offer第三十整數1出現的次數(從1到n整數1出現的次數)

題目描述 求出1~13的整數中1出現的次數,並算出100~1300的整數中1出現的次數?為此他特別數了一下1~13中包含1的數字有1、10、11、12、13因此共出現6次,但是對於後面問題他就沒轍了。ACMer希望你們幫幫他,並把問題更加普遍化,可以很快的求出任意非負整數區

Java 的列舉

在 Java 中, 列舉, 也稱為列舉型別, 其是一種特殊的資料型別, 它使得變數能夠稱為一組預定義的常量。 其目的是強制編譯時型別安全。 因此, 在 Java 中, enum 是保留的關鍵字。 1. 列舉的定義 在 Java 是在 JDK 1.4 時決定引入的, 其在 JDK 1

MFC多文件(檢視獲取文件指標

多文件系列 MFC多文件(一):檢視中獲取文件指標 MFC多文件(二):文件中獲取檢視指標 MFC多文件(三):文件與檢視繫結   問題 文件與檢視繫結後,在檢視中如何獲取文件指標?   新建MFC多文件工程(命名為Test),自動生成了一個C

Java 的泛型(

目錄 1 泛型 1.1 為什麼需要泛型 1.2 型別引數命名規約 2 泛型的簡單實用 2.1 最基本最常用 2.2 簡單泛型類 2.2.1 非泛型類 2.2.2 泛型類的定義 2.2.3 泛型類的使用

Silverlight微軟技術(下)微軟技術技術學習

經常聽到有人說微軟的技術變化太快,持續性不好,讓程式設計師追得很累。這種觀點在微軟技術社群內部和外部都有出現,似乎是一個不爭的事實。但從我追隨.NET平臺這近十年的時間裡,我並沒有明顯的感覺。微軟的技術的確很多,但至少在.NET領域過渡性做的非常好,我沒有任何疲憊之感。微軟技術開拓了我的眼界,讓我在微軟內外許

Silverlight微軟技術(上)微軟拋棄Silverlight了麼?

話說,在最近的PDC上,微軟的副總裁Bob Muglia說了類似的話“我們對Silverlight的策略改變了,我們要用HTML5來實現跨平臺的應用程式”,於是乎,社群鋪天蓋地響起了“微軟要拋棄Silverlight”的調調。出現這個說法並不奇怪,媒體轉述一遍,再給社群理解一下,很正常。但是我覺得奇怪甚至有些

Java高併發程式設計(十Java執行緒池

在開發過程中,合理地使用執行緒池能夠帶來3個好處。 降低資源消耗。通過重複利用已建立的執行緒降低執行緒建立和銷燬造成的消耗。 提高響應速度。當任務到達時,任務可以不需要等到執行緒建立就能立即執行。 提高執行緒的可管理性。執行緒是稀缺資源,如果無限制地建立

CES展驚豔的國發布 繪王數位產品專業手寫體驗

作為全球規模最大、影響力最為廣泛的消費技術產業盛會,國際消費類電子產品展覽會(CES展)於2017年1月5日-8日在美國拉斯維加斯盛大舉行。繪王動漫科技有限公司(Huion)攜旗下最新電磁式手寫輸入解決方案在此次國際大型展會中精彩亮相,並受到國外媒體和參觀者的一致認可和熱

斯坦福AI實驗室力作深度學習還能進一步擴充套件 | CVPR2016最佳學生論文詳解

結構遞迴神經網路: 時空領域影象中的深度學習 聯合編譯:陳圳、章敏、Blake 摘要 雖然相當適合用來進行序列建模,但深度遞迴神經網路體系結構缺乏直觀的高階時空架構。計算機視覺領域的許多問題都固有存在高階架構,所以我們思考從這方面進行提高。在解決現實世界中的高階直覺

每日Android 記憶體洩漏都有哪些注意點?

記憶體洩漏對每一位 Android 開發一定是司空見慣,大家或多或少都肯定有些許接觸。大家都知道,每一個手機都有一定的承載上限,多處的記憶體洩漏堆積一定會堆積如山,最終出現記憶體爆炸 OOM。 而這,也是極有可能在 Android 面試中一道常見的開放題。 記憶體洩漏的根本原因是一個長生命週期的物件持有了一個

程式碼檢查利器ArchUnit

Code Review總是讓人又愛又恨,它可以幫助我們在提測之前發現很多程式碼中比較“丟人”的問題,但是,Code Review通常會比寫程式碼更加耗費精力,因為你需要理解別人的程式碼,而為了這一目的,往往需要很多次的溝通。 人們常說“見字如面”。我認為程式碼也是一樣,看到一個人的程式碼,就會對這個人有一個大

redis學習2redis的資料結構結構物件

第1章 前言 redis這麼強大,那麼它底層是如何實現的呢?使用了哪些資料結構呢?本文就帶大家來剖析剖析 第2章 簡單動態字串(SDS)   redis的字串不是直接用c語言的字串,而是用了一種稱為簡單動態字串(SDS)的抽象型別,並將其作為預設字串。   redis中包含字串值的鍵

C語言函式引數的傳值傳地址

任務程式碼: #include <stdio.h> void swap(int *a ,int *b)//按之前對指標認識,*a代表指標變數a,a儲存的是地址,*a是地址的值。 { //但是可以看到下面傳輸過程中swap(

Intel硬編碼(Opcode Map、定長指令指令字首

Intel CPU(基於P6微架構)的機器指令(硬編碼)格式如下圖所示: 一條指令由:**指令字首(Instruction Prefixes) + 操作碼(Opcode) + ModR/M + SIB + 偏移(displacement) + 立即數(Imme

ArcGIS教程ArcGIS的座標系統定義投影轉換

        座標系統是GIS資料重要的數學基礎,用於表示地理要素、影象和觀測結果的參照系統,座標系統的定義能夠保證地理資料在軟體中正確的顯示其位置、方向和距離,缺少座標系統的GIS資料是不完善的,因此在ArcGIS軟體中正確的定義座標系統以及進行投影轉換的操作非常重要。

AndroidEditText切換密碼的顯示隱藏

不少應用都要註冊賬戶,設定密碼登入後才能使用app,而在輸入密碼時可能會忘記之前輸入的密碼,為了方便使用者,可以加入一個按鈕或者checkbox,在選中或點選後把密碼更改為顯示,再點選多一次就變回隱藏

凸優化筆記(仿射集,凸集

一.直線和線段 設為空間中的兩個點。 直線: 線段: 二.仿射集(Affine Set)凸集(Convex Set)和錐(Cones) 仿射集 仿射集:通過集合中