AI如何挑戰傳統翻譯
1 次檢視
在過去的十年中,翻譯服務呈指數增長,包括Travis Translator等硬體裝置 , Waverly Labs的飛行員, 微軟翻譯等耳機 – 不僅翻譯文字,還翻譯語音,影象和街道標誌 – Google翻譯,和Facebook翻譯。由於機器翻譯,翻譯速度更快,準確度更高。
但這對傳統翻譯來說意味著什麼呢?作為德國的外籍人士,我是翻譯服務和翻譯軟體的使用者,因此我有興趣瞭解更多資訊。我採訪了Gengo的執行長兼創始人Matt Romaine。他於2009年共同創立了Gengo,旨在實現全球語言愛好者獲得機會的民主化,併成為大眾全球交流的橋樑。Gengo現在提供眾包翻譯人員,擁有超過20,000名翻譯人員,支援35種語言。他們的客戶包括Trip Advisor,Etsy,Salesforce,eBay,Facebook和Google。
機器學習為翻譯服務帶來新機遇
機器學習的進步並沒有消除對翻譯人員的需求,而是創造了一種新的經濟,並響應了對豐富的多語言資料來培訓人工智慧系統的迫切需求。今年早些時候,該公司推出了 Gengo.ai ,這是一個按需平臺,為機器學習系統的開發人員提供 Gengo翻譯 提供的各種多語言服務。可用的服務包括情緒分析,內容稽核或任何型別的內容評估服務,例如實體提取,搜尋引擎培訓和聊天機器人培訓。
正如馬特解釋的那樣,“我們開始注意到人們可以通過其他方式使用我們的多系統眾包服務。例如,客戶要求讓我們的翻譯人員評估他們所產生的錄音的發音和發音。當我們進一步挖掘時,客戶正在開發一種機器學習系統,要麼能夠響應像Siri或Google home這樣的口頭命令,要麼開發一種能夠以更易理解的語調說話的系統。
AI就像一個小孩。孩子受教育的型別對結果有很大影響。培訓資料對於提高AI和機器學習系統的質量非常重要。我們擁有龐大的人才群和一個全新的商業機會,類似於亞馬遜的機械土耳其人,你可以讓大批人做簡單的任務,但實際上有一系列需要各種專業知識的人,包括語言背景,你需要理解用不同語言表達短語的情緒。這就是我們如何定位自己現在可以使用最初接受過翻譯培訓並可以申請機器學習和資料應用的人群。“
需要深入分析
Gengo.ai正在開展一系列專案,展示對結構化,高質量資料的需求,使AI系統能夠處理需要文化和種族專業知識的更廣泛的任務。Matt分享了錄製語音資料的例子,以幫助AI更好地瞭解移民(對於頂級汽車製造商),為2020年東京奧運會做準備。
“基本上,有一個汽車導航系統製造商,他們已經決定建立一個能夠理解非本地日語演講的系統。所以他們需要的是日語錄制的小時和小時,但是通過輕微的語調說出來。所以我們是我們已經擁有這一人口統計資料的唯一平臺之一。我們能夠收集這些資料並擴充套件日語語言致謝,以便他們與非母語人士合作。“ Gengo能夠建立一個音訊資料集,其中包含數百個非母語日語使用者的錄音。
該公司還參與各種活動,如從不同種族(從轉換器池)採購眼球運動,以幫助研究自閉症和收集母語人士的手寫日文字樣樣本,以培訓OCR引擎閱讀手寫檔案
人工智慧是如何推進的?
我很好奇馬特對人工智慧的進展的看法,解釋了一篇有趣的文章,我讀到了關於 人類 對 人工智慧進行原型設計的詳細說明,其中詳細記錄了人類做工作的檔案,這些工作由人工智慧提供。馬特指出:
“我們並不是每個人的想象都認為我們會想到的。我們正在做的工作型別已逐漸變得非常具體。我們不僅僅是識別影象或語言,而是在確定特定平臺內的語調和情感分析。有趣的是,如果我把它與翻譯空間聯絡起來,媒體上的人經常會談論機器翻譯如何讓所有翻譯人員失業。但我們實際上更有可能看到更少的人,但是那些受僱的人更多複雜的工作。
我很想知道Matt對翻譯裝置的看法。他指出:
“我認為他們太棒了。我的意思是他們打破了語言障礙,他們使溝通變得更加流暢,並在大多數情況下改善了人類的互動。語言就像一個活生生的有機體一樣生活。所以總會有新的這些詞語和不同代。這裡有新的術語。所以他們總是需要知道那些裝置是否需要人工輸入,並且經過培訓才能進行他們的翻譯工作。因此,需要更少的人來開發像這樣的裝置,但總會有人可能是一個年輕的人群,可以解釋你的術語或新機器能夠將其轉化為使用的新詞。“
自Gengo.ai推出 以來,該公司迄今已處理了超過10億字。該公司為AI開發人員提供了一系列免費資源,例如 50個最佳的機器學習免費資料集。AI開發人員可以通過將預先存在的檔案傳送給Gengo的個人客戶經理進行稽核來訂購AI培訓資料,也可以使用Gengo.ai API訪問大量資料。
微信讚賞
支付寶讚賞
