1. 程式人生 > >開源 | IBM、哈佛共同研發:Seq2Seq模型視覺化工具

開源 | IBM、哈佛共同研發:Seq2Seq模型視覺化工具

640?wx_fmt=jpeg


作者 | Ben Dickson

譯者 | 劉旭坤

編輯 | Jane

出品 | AI科技大本營


近年來隨著深度學習和神經網路技術的發展,機器翻譯也取得了長足的進步。神經網路結構越來越複雜,但我們始終無法解釋內部發生了什麼,“黑箱問題”一直困擾著我們。我們不清楚程式在翻譯過程中如何進行決策,所以當翻譯出錯時也很難改正。隨著深度學習在各行各業中的廣泛應用,深度學習的不可解釋性已經成為其面臨的嚴峻挑戰之一。


今年,在德國柏林舉辦的 IEEE VAST 視覺化分析大會上,來自 IBM 和哈佛大學的研究人員展示了為解決翻譯中的 AI 黑盒問題所開發的除錯工具。這款名為 Seq2Seq-Vis 的工具能將人工智慧的翻譯過程進行視覺化,方便開發人員對模型進行除錯。


Seq2Seq-Vis 主要針對機器翻譯中最常用的 Seq2Seq 模型。這一模型能夠將任意長度的序列,也就是原文的句子,對映到目標語言。除了機器翻譯任務,在自動問答、文字摘要等任務中也都主要應用 Seq2Seq 模型。


簡單來說,Seq2Seq 模型在機器翻譯中的工作原理就是把源語言對映到目標語言,得到了目標語言的序列(也就是初步翻譯完的句子)後再進行優化,保證語法和語義上的正確。雖然使用神經網路模型後,機器翻譯的結果得到了很大的提升,但同時也非常複雜。


視覺化機器翻譯的過程


研究人員稱研發 Seq2Seq-Vis 的初衷是想有一個類似於基於規則的傳統翻譯軟體中的規則表,這樣開發人員可以通過在規則表中對照得到錯誤資訊就可以很簡單地修改模型。



Seq2Seq-Vis.io 網站上給出了一個從德語到英語的演示程式。德語的“die längsten reisen fangen an , wenn es auf den straßen dunkel wird.”翻譯成英語應該是“The longest journeys begin when it gets dark in the streets.”,但被機器翻譯成了“the longest travel begins when it gets to the streets.”Seq2Seq-Vis 以視覺化的方式呈現出了序列到序列模型翻譯的每一步,這樣使用者就能像查詢規則表一樣來找出機器翻譯翻譯錯誤的原因。


640?wx_fmt=png


Seq2Seq-Vis 另一個很有用的功能是它能找出與某個字詞相關的訓練集,這也是解決 AI 黑盒問題的一大難點。其實一個機器學習模型除了訓練集一無所知,所以要解決機器翻譯中的錯誤最終都要回到訓練集中去。


640?wx_fmt=png


將機器翻譯過程視覺化,使用者就能確定翻譯出錯到底是編碼器解碼器使用的訓練樣本出了錯還是注意力模型的設定或者其他環節出錯了。


更正序列到序列模型


Seq2Seq-Vis 並不是第一個試圖解決 AI 黑盒問題的工具,之前有很多大公司和研究機構都有進行嘗試,甚至 IBM 自己也在這上面下過功夫。事實上,很多類似的工具需要的資訊比 Seq2Seq-Vis 更少,比如有的工具只需要神經網路的輸出就可以,而 Seq2Seq-Vis 還需要訓練集,整個模型的架構和設定。但 Seq2Seq-Vis 卻是第一個既能視覺化模型的決策過程也能讓開發人員直接修改模型的工具。開發人員可以通過視覺化的方式對模型的決策過程進行修改並觀察反饋來實現探索式的除錯,比如修改輸出序列的單詞或者對注意力模型的配置進行修改。


640?wx_fmt=png


聽起來是不是很酷,不過 Seq2Seq-Vis 的目標群體是模型架構師或工程師而非機器翻譯的終端使用者。因為要讓這一工具真正發揮作用需要使用者對“序列到序列”模型有較為深入的瞭解。雖然目標這一工具還只是應用在IBM的內部專案中,但它是開源的,所以大家都可以來試試。


  • 專案地址:http://seq2seq-vis.io

  • Github地址:https://github.com/HendrikStrobelt/Seq2Seq-Vis

  • 原文地址: https://venturebeat.com/2018/11/01/ibm-harvard-develop-tool-to-tackle-black-box-problem-in-ai-translation/


本文由AI科技大本營翻譯,轉載請聯絡微信1092722531


2018 中國大資料技術大會

BDTC 2018


BDTC 2018中國大資料技術大會攜主題“大資料新應用”再度強勢來襲。本次大會由華東師範大學副校長、教授周傲英,百度商業智慧實驗室主任熊輝,阿里巴巴副總裁李飛飛三位會議主席對大會內容把關,多位兩院院士參與指導,由最瞭解行業痛點的一線從業者為同行打造。


八折優惠僅最後一天,掃描二維碼一鍵搶票,預定屬於你的超強幹貨。點選「閱讀原文」檢視大會詳情。


640?wx_fmt=png


推薦閱讀

下次面試若再被問到二叉樹,希望你能對答如流!

亞馬遜AWS釋出AWS RoboMaker 可直接部署機器人

程式設計師的江湖 務必掌握這些黑話!

高達800萬次下載量的npm包被黑客篡改了程式碼,你的裝置或正成為挖礦機