1. 程式人生 > >人工智能又攻下一城:從智能翻譯機掀起的AI硬件銷售熱潮說起

人工智能又攻下一城:從智能翻譯機掀起的AI硬件銷售熱潮說起

翻譯機

恐怕誰也沒想到,智能翻譯機這樣看似小眾的產品能引起AI硬件的銷售熱潮。

數據顯示,最近在京東預售的搜狗旅行翻譯寶在3月19日開售一小時後就被搶購一空。”據悉,搜狗此次銷售額破 1000 萬,登頂京東該品類冠軍。”

如果說AlphaGo第一次讓AI走進人們的視野,那搜狗旅行翻譯寶則又攻破一城,讓AI走進了人們的生活。

技術分享圖片

在此前,翻譯機市場一直面對著艱難的落地應用問題:翻譯質量差、語種數量少暫時不提,很多翻譯機還要求必須連接網絡才能應用,在很多場景中其便利程度遠低於手機上的翻譯軟件。

但翻看搜狗旅行翻譯寶京東購買頁下的用戶反饋與評論,我們可以看到,目前94%以上的用戶在使用後還是對產品給予了支持與認可。在產品功能上多數用戶表示“在離線狀態下翻譯很準確”、“語音識別靈敏,比較復雜的英語句子翻譯成中文也很好”;而在提及應用場景時,也有用戶表示“作為一個英語盲,在國際航班上不敢點餐,說了別人也聽不懂。不敢一個人去坐中轉航班,看不懂也聽不懂”。當然也有人提出升級建議,包括離線翻譯、拍照翻譯需要增加英文之外的語種擴充等。

看來AI技術賦予給搜狗旅行翻譯寶的離線、高質量、多語種翻譯能力完美貼合了消費者對智能翻譯機的想象。在這一眾多科技企業著手布局的領域,搜狗無疑站到了前列。消費者的一致好評也說明,這款產品切實改變了以往國人跨國溝通不暢的窘境。而AI的力量也從阿爾法狗的棋盤中走向生活,造就了第一款適用於消費者的智能翻譯機。

當翻譯App日益強大,什麽才是智能翻譯機的自我修養?

那麽相較於其他同品類的產品,搜狗是怎麽做到真正實用的?搜狗CEO王小川對此解釋是:離線翻譯,拍照翻譯,多語種互譯。

想象一下,旅行中最常出現的情況是什麽?

在地鐵、飛機等交通工具中信號不暢,自己卻看不懂地名?購買的海外流量包用盡,卻為了和他人溝通到處找WiFi使用翻譯App?

可即使網絡順暢,翻譯App也常常表現不佳。不光翻譯質量差,在比較嘈雜的市場、景點中很難精準識別語音。幾種局限場景,幾乎覆蓋了出國旅行的絕大部分狀況。

正是這些不便打開了智能翻譯機的生存空間。

針對這些問題,搜狗提出了雙麥克風陣列+離線翻譯技術的解決方案。

通過全指向性I2S數字雙麥克陣列結合多項拾音技術,有效規避噪聲、遠場拾音,提升了噪聲場景下的語音精度,從而確保高質量的翻譯效果。這樣一來,在室內環境中多人低聲交談時,翻譯寶可以準確收音,語音識別速度也基本做到了實時同步。

在離線翻譯方面,搜狗基於transformer結構的離線機器翻譯技術也是業內首家,在沒有任何網絡的時候也能實現語音翻譯和拍照翻譯功能。當然不依賴網絡自然意味著在終端進行計算,為了補充算力搜狗旅行翻譯寶搭載了GPU芯片,這是市面上第一款搭載了GPU的智能翻譯機。

有了強大的算力加持,通過運算定制,針對識別、翻譯、合成涉及到的矩陣運算進行定制優化,可以使得語音翻譯的延遲嚴格控制在1s以內。這樣的速度甚至超過了很多翻譯App在4G網絡環境下的速度。

當然搜狗自身在NLP,尤其是機器翻譯領域的實力也不可小覷。搜狗的神經網絡翻譯系統在2017 年國際頂級機器翻譯比賽 WMT 中獲得了中英和英中雙向翻譯冠軍。有測試表示,搭載了這一技術的翻譯寶在中英離線翻譯的翻譯速度與準確率也高於同類競品。

但真正讓旅行翻譯寶區別於競品的,還是拍照翻譯功能。

技術分享圖片

拍照翻譯在這兩年於手機App中流行開來,通過圖像識別功能找到圖片中的文字並進行翻譯,為用戶提供了很多便利。翻譯路標、菜單…尤其是面對一些對英語不熟悉,手機輸入翻譯困難的用戶,圖片翻譯幾乎是唯一解決途徑。相比之下,只能翻譯語音的翻譯機們又落後一局。

王小川在推出旅行翻譯寶時,就曾表示“我們不一樣”。加入拍照翻譯功能,就是相比競品的一大差異化優勢,

搜狗旅行翻譯寶的拍照翻譯功能搭載了搜狗業內領先的OCR文字識別技術,可處理“復雜背景、光線弱、拍照抖動、文字折行”等問題,搭配500W像素攝像頭與3.1寸高清屏幕,針對出境遊會遇到的找路、吃飯、看展和購物時“看不懂”的問題,實現“即拍即翻”。用戶只需要拍攝要翻譯的內容,比如路牌、菜單、名畫介紹、商品說明,機器就能直接將圖片內的外語翻譯為中文,讓用戶不用再逐字費力輸入外語。

需要註意的是,目前拍照翻譯還只支持中英之間的翻譯,如果未來擴展到日韓俄這類手機原生輸入法不支持的語言,恐怕會成為最實用翻譯產品,再次掀起熱潮。

在多語種互譯上,搜狗旅行翻譯寶也能滿足用戶出行的多語言需求,據統計,目前世界上使用語言最多的十種分別為:英、法、西、阿拉伯、中、俄、德、葡萄牙、印地、日。翻看了下,搜狗旅行翻譯寶已全部涵蓋這十門語言。此外還多提供了韓語、泰語、荷蘭語、波蘭語、芬蘭語、丹麥語、瑞典語、意大利語另外8種語言,覆蓋世界200多個國家,而同品類其他競品目前只支持5種左右的語言。

最重要的是,這18種語言在聯網狀態下全部支持互譯,未來的用戶場景也不僅僅只針對中國人,將可以實現全世界人民的跨國交流。

加碼機器翻譯,搜狗如何幫助中國溝通全球?

很多人對搜狗的AI發展策略存有這樣一個疑問:當其他企業都用音箱這種場景更廣泛的產品打入硬件市場,為什麽搜狗劍走偏鋒的選擇了智能翻譯機?

簡單來看,可以找到兩點理由。第一是因為搜狗通過輸入法、語音輸入法等產品在NLP技術上得到了更多累積,推出翻譯機產品更得心應手。第二是翻譯機多國語言互譯的功能不僅僅適用於中國市場,搜狗有可能借助這款產品在全國市場走的更遠。

可僅僅停留在市場層面,未免會低估搜狗對於翻譯這件事抱有的情懷。

王小川此前曾用“發明電”來類比翻譯的實用:“翻譯技術走向實用化不亞於人類發明電,同樣是歷史突破。今天各個國家沖突,各個之間不信任是因為語言和文化引起,一旦翻譯技術被解決掉,我們可以很容易獲得全球信息,國外也了解我們的信息,世界會發生變化。”

技術分享圖片

其實仔細觀察搜狗在機器翻譯方面的布局,會發現搜狗早已進入這一領域。

在 2016 年的烏鎮世界互聯網大會上,搜狗對外率先展示了搜狗機器同傳技術,實現全球首次機器翻譯實用化。隨後,還為前哨大會、香港 RISE 峰會、CCF-GAIR 峰會、達沃斯論壇等上百場大會提供機器同傳支持。同時,搜狗還將翻譯與核心產品搜索、輸入法結合:上線全球首個跨語言搜索引擎,將機器翻譯與搜索技術相結合,讓用戶能夠用中文查詢和閱讀英日韓網站的翻譯結果;在搜狗輸入法中首創性地加入翻譯功能,讓用戶在聊天場景下,能夠進行中英日韓語音和文字輸入的自動翻譯,無需復制粘貼,更不用在社交軟件和翻譯 APP 中來回切換。

從toB應用的機器同傳,到終端上的搜索、輸入法、翻譯App,再到覆蓋更多人群場景的旅行翻譯寶,搜狗正在翻譯領域越紮越深。而應用於旅行場景的翻譯寶也僅僅是一個開始,教學、商業、出版…一切你能想象到的,需要溝通的地方,都是機器翻譯的應用領域。

當很多科技企業還沒有發現這片沃土的時候,搜狗已經播種完畢,準備收割了。

在和廠商的交流中,很多廠商都曾表示過AI硬件銷量低、使用率也低,其實根本問題就在於這些硬件沒能對用戶的生活做出改變。如今看來,加強人與人之間的溝通效率,很可能是AI硬件對我們生活形成的最大變革。

如今中國正承擔著共建人類命運共同體的全球使命,走向世界、與全球交流已經成為了一種必然。而機器翻譯日益強大的能力剛好可以為這一使命賦能,滿足我們和全球溝通的剛需。

從圍棋、遊戲、駕駛再到翻譯,人工智能不斷攻城掠地。但在智能翻譯機這一征程上,並非為了在某一領域打敗人類,而是打破溝通的邊界,用技術穿過了千百年來形成了語言鴻溝,使我們與彼此再次相遇。


人工智能又攻下一城:從智能翻譯機掀起的AI硬件銷售熱潮說起