AI同傳的責難與正名,科技文明的進步與挑戰
文丨闌夕
以色列歷史學家尤瓦爾·赫拉利認為,語言是人類有別於其他動物擁有智慧之名的「最獨特功能」,儘管從小到螞蟻大到鯨魚的不同物種都具備獨特溝通方式,但唯有人類可以通過語言進行虛構、創作、邏輯、想象乃至沉澱思想,最終推動了心智的進化。
而隨著科技文明的前行,語言本身所具備的技能屬性逐漸消退,新興技術推進落地下的機器翻譯乃至AI同傳正走上舞臺中央。
早在2012年,谷歌就曾嘗試把翻譯系統融入進硬體終端,併為此畫下了一個美妙的藍圖,即使用智慧手機通話的雙方可以各說各的母語,系統將其自動翻譯轉化為對方的母語,再傳輸給對方,這宛如科幻電影的一幕令人頗為期待。
可惜受限於彼時技術的不夠成熟,這項嘗試最終以擱淺收場。而近年來AI技術的快速發展再度為上述機器翻譯的理想應用場景帶來了曙光——去年穀歌以耳機配件的形式釋出內建語言翻譯應用的Pixel Buds。
然而,正如科幻小說家亞瑟·克拉克所提出的「克拉克第三定律」所說,「任何非常先進的技術,初看都與魔法無異。」
新興技術在誕生初期往往要遭遇意料之外的挫折,今年9月下旬,科大訊飛被曝出在今年的創新與新興產業發展國際會議上用人工翻譯冒充AI同傳,並在沒有徵得同傳工作人員同意的情況下就冒名使用翻譯成果。
儘管科大訊飛第一時間出面,以「從始至終都強調人機耦合——而非AI同傳——才是機器翻譯的未來」為由做出辯解,但依然擋不住輿論譁然,其股價也在此後的一個月裡跌去了近三分之一。
而本身難度係數較大,涉及語音識別、機器翻譯、語音合成等多項技術挑戰的AI同傳也因此陷入了業界責難與質疑的境地,「AI同傳是否還有未來」這一辯題也再度被擺在了檯面之上。
與科大訊飛的遭遇相映成趣的是,日前,搜狗旗下AI同傳技術先後登場亮相本月上旬舉辦的中國網球公開賽、國際馬術大師賽,以中英雙語實時字幕幫助到場觀眾順暢的瞭解諸如場地接受、選手採訪等一系列資訊,為觀眾們消除了共度體育盛會的語言隔閡,極大的優化了觀賽體驗。
一個更加直觀的例子是,在中國網球公開賽上——亦是亞洲最高級別的綜合型網球賽事——丹麥選手沃茲尼亞奇時隔8年再度斬獲女單冠軍,賽後採訪中她面對鏡頭說出「感謝中網,中網是我最喜歡的賽事之一」時,大螢幕上同步展示了中文字幕,精準高效的翻譯水準讓所有觀眾秒懂了她的這句話,也瞬間響起了一片歡呼聲。
一言以蔽之,搜狗AI同傳在成為國內首個為國際賽事提供機器翻譯的同傳系統之餘,也為「科技讓世界無距」這一理念做出了又一次展示。
其實,一直以來,搜狗都以「語言」為核心持續推動AI技術的研發和落地,這一方面體現在其在2012年就已立項人工智慧,時至今日已經實現在語音識別、語音合成、人機互動等多方面穩居全球領跑陣營。例如,搜狗語音識別擁有超過98%的識別率、每分鐘可輸入400字以上的國際領先技術水準。
正如上文所說,AI同傳工作不僅要求機器能夠流暢的記錄、翻譯內容,還必須能良好的識別詞語和句子的停頓,需要覆蓋語音斷句、語音識別、文字斷句、機器翻譯等多個技術維度,以此方能實現穩定高效,媲美乃至超越人工同傳的臨場表現。
這就決定了AI同傳始終面對的都是多項AI技術的挑戰,對於優化資源整合,打通技術協作的要求更加嚴苛。
搜狗也正是這樣做的,早在其語音識別系統構建之初就寫進了搜尋引擎的產品底層,每天4億次語音請求的請求、33萬小時的語料構成了機器學習的最佳教材,這最終融入了搜狗的硬體層面——諸如搜狗旅行翻譯寶等硬體產品的推出也坐實了搜狗領先的技術落地能力。
而在難度係數更大的AI同傳方面,搜狗在技術上的表現並不稍弱於谷歌等科技巨頭。例如與谷歌GNMT的八層結構相比,搜狗同傳的神經網路精簡為五層,提高了自然語言處理和深度學習的效率。
再比如在文字斷句這一語音識別和機器翻譯之間的最關鍵環節,搜狗AI同傳一方面通過內容平滑技術去掉無意義詞語,使句子變得通順,然後通過規則和模型兩種方法進行語句劃分並加標點。
另一方面則將語音識別技術和機器翻譯技術進行了結合,採用端到端的神經網路翻譯技術,通過編碼端獲取源端句子的分散式表示,利用注意力模型聚焦源端,使用迴圈神經網路生成翻譯結果,最終實現了AI同傳翻譯結果比傳統機器翻譯的精準度還要高出30%~40%。
事實上,最近一年以來,搜狗的AI同傳技術已經為包括聯合國教科文大會、人工智慧產業峰會、2018中國大資料應用大會、2018NBI夏季創新峰會在內的上百場大型會議、活動服務過,如今能夠站上國際賽事為AI同傳正名並不令人感到意外。
作為一項早在半個世紀前就是學術界座上賓的熱門議程,AI的發展始終都受限於技術瓶頸,更一度被視為是自動化的延續,直到運算能力及規則突破曾經認為框定的天花板,我們方才能夠迎來AI的開花結果。
換言之,科大訊飛在AI同傳上所遭遇的挫折或者說碰壁,並不能左右後者的未來。
就像大航海時代的盛況,AI領域已經被視作那黃金資源空前富饒的遙遠大陸,儘管劍指這已被科幻文藝提前發揚光大多年的未來世界的野望並無二致,但受限於航線方向、船隊規模和支撐勢力的各自不同,總會有人無法到達成功的彼岸。
八十多年前,劉易斯·芒福德曾憂心忡忡的告誡社會,警惕這種臣服於精密機器的可能性,「當教徒可以經由《聖經》的印刷品感知上帝的時候,他也就被削弱了前往教堂親歷神父傳道的慾望,當電話鈴聲不受主人約束的隨時可以在書房裡響起,工作和生活的連貫也就從此變得昂貴起來。」
但正如愛因斯坦所說,「我從不去想未來,因為它來的夠快。」
科技革命對於生產力和生產效率的刺激會帶來更為充盈和廉價的商品,最終造福於整個社會,相較於哲人們的精神潔癖,這種實實在在的福祉無疑值得期待。