1. 程式人生 > >局部戰爭還是全面入侵?如何看待搜狗錄音翻譯筆?

局部戰爭還是全面入侵?如何看待搜狗錄音翻譯筆?

搜狗錄音筆

科技產品的更新換代頻率之快,差不多是每個人都能感受到的。但在極速叠代的硬件大潮中,有沒有產品技術陷入停滯,僅僅依靠市場剛需維持增長速度的電子產品呢?其實仔細找找就會發現,這樣的產品還非常多。比如說我們的媒體同行、商務人士和學生黨的標配,走到哪都要帶著的錄音筆,就是這樣一個例子。

我們能看到的是,中國市場的錄音筆每年保持著百萬臺級別的銷售量,但錄音筆本身的功能更新卻近乎空白,新產品僅僅依靠價格、待機時間、收音效果來保持增長。這種不用快跑也能生存的硬件市場之所以存在,是因為剛需直接催生了市場份額。錄音筆產品雖然看似不大,但卻是很多生活、工作、學習場景所中不可替代的工具。無論是記者采訪、秘書整理會議紀要,還是學生完成學業工作,都無法用其他工具來代替錄音筆。久而久之,就把這個重要但不起眼的市場變成了真空地帶,以至於大家似乎都忘記了錄音筆這東西也是能進行科技創新的——但AI並沒有忘記它。

剛剛,搜狗推出了錄音翻譯筆,這款產品剛一面世就引來了巨大關註。其原因很容易理解,因為搜狗的錄音翻譯筆,在價格與其他錄音筆持平甚至更低價的前提下,居然增加了速記、翻譯、同傳這些原本非常昂貴的新功能。知乎上有用戶說,這簡直直接推翻了購買傳統錄音筆的必要性,就連馬化騰都在第一時間下單搶購了一臺。

技術分享圖片

但在一個產品之外,我們似乎可以看到更多。錄音筆僅僅是個小的硬件場景,或者說只是個開始。AI帶來的機器翻譯、語音識別等功能,會不會將在完成AI+錄音筆後,進行模式復制,一個又一個地去推翻我們熟悉的場景,走入更智能的時代?

這麽看來,搜狗錄音翻譯筆的背後,或許不僅是一場單一科技硬件的局部戰爭,更隱藏著一場山雨欲來的AI全面入侵。這就很有可以開腦洞的地方了…

技術分享圖片

推翻已有產品的全部價值,才能創建新入口:錄音筆的閃點狙擊

在進行錄音筆的推理前,我們不妨思考這樣一個問題:今天大家還能看到帶按鍵、連藍牙的“智能音箱”嗎?好像不太現實,即使路邊攤掃碼就送的音箱,如今也基本是語音交互的AI音箱了。從亞馬遜推出Echo,到國內BAT、京東等公司爭相進入音箱市場,再到華強北數千家工廠開工做AI音箱,短時間對話式交互、能夠指揮智能家居、連接電商的音箱產品籠罩了整個中國。之所以會出現這種現象,是因為在AI帶來的交互改變面前,傳統藍牙音箱已經失去了所有價值:價格不便宜、音質都一樣、功能不及新音箱的十分之一。這種情況下,誰還會留戀此前的音箱產品呢?整個產業也瞬間拋棄了過去。

同樣的顛覆故事,今天似乎開始在錄音筆身上上演。我們知道,大多數錄音筆的功能僅僅是錄音和播放,稍微智能點的也就是加上上傳到雲端。這功能確實寡淡,但也無法被手機等硬件取代。不能取代,卻不代表無法顛覆。假如新的硬件形態保留了原有硬件的價格和功能,又加入了全新的功能,豈不是馬上“改朝換代”?尤其是在新功能足夠重要的情況下。

比如說,同時具有速記、翻譯和同傳能力的錄音筆。搜狗的錄音翻譯筆的價值就在於此。基於搜狗AI帶來的語音識別、NLP和機器翻譯能力,這款產品集成了速記、同傳等十分重要,但錄音筆無法實現的功能。

技術分享圖片

比如說,搜狗錄音翻譯筆支持同聲傳譯 3 秒上屏顯示。將錄音翻譯筆與手機連接,即可在手機端 APP 查看實時的語音識別結果與翻譯結果,並可直接保存和分享錄音及同傳文件。

換句話說,在用錄音筆收到一段英文之後,用戶可以馬上就得到三件東西:錄音、這段錄音的文字整理、這段錄音的翻譯結果。

如果時間倒回到不久之前,一名記者采訪了位外國人。整個從整理文檔到翻譯內容需要多久呢?大約是一個通宵,而在搜狗錄音翻譯筆出現後,大約不需要時間。據了解,目前搜狗錄音翻譯筆支持中英與英中同傳,語音識別準確率中文 97%,英文 95%。基於搜狗的神經網絡機器翻譯技術,同傳翻譯準確率達 90%,基本可以支持跨語種實時對話的需要。而其將錄音轉化成文字,最快可以支持400 字每分鐘,也可以說是非常高效。人工同傳和同傳設備的價格之昂貴,是大家都知道的。商用的機器同傳也只是企業們能用得起。而搜狗這次竟然推出了價格398元的完全面向普通消費者的錄音筆。毫無疑問,用戶在新購買一只錄音筆的時候,已經不需要做什麽選擇了。要知道,錄音筆從前僅僅提供的是一種工具,而在可以完成速記識別、錄音翻譯和同聲傳譯功能之後,錄音筆更多是在為用戶提供此前必須依靠人力才能獲得的服務。AI的奇妙之處或許正在於此。通過將經驗和識別能力壓縮成硬件能力,一場錄音筆市場的閃點狙擊就此完成。

但在錄音筆戰役之外,或許我們能看到這場戰爭還遠遠沒有結束。

翻譯是硬件的命門所在:搜狗的區域戰爭

通過搜狗翻譯錄音筆的產品功能,我們會發現這樣一個現象:可搭載在硬件上,快速準確的翻譯能力成為了產品的一個價值驅動點。在全球化的今天,人們對跨語言表達和獲取信息的需求也越來越高,產品的翻譯能力會成為影響用戶消費的重要因素。

技術分享圖片

而且,翻譯能力是一個辦公、社交、商務、旅行場景中會反復用到的能力,用戶對翻譯的需求往往是隨時隨地產生的。而傳統的硬件系統中,因為受限於語音識別和機器翻譯技術的準確率,加上硬件研發的不配套,我們很少能夠在硬件上看到翻譯、甚至同傳這類的能力方案。但從搜狗此前推出的旅行翻譯寶,再到如今的搜狗翻譯錄音筆,我們可以看到搜狗的“翻譯+硬件”正在形成一個賦能公式,一個個打開垂直硬件生態的新商業空間。在世界化飛快演進的今天,對泛在化翻譯的渴求很快會變成科技產品的命門。從搜狗的硬件思路中,我們可以看到翻譯能力成為了其硬件的樞紐和市場通行證,把底層的AI技術和尖部的硬件場景聯系到一起,組成了完整可復制的硬件解決方案。再觀察搜狗從文字翻譯、對話翻譯、圖像翻譯到首家實現同傳在消費級產品上的落地,搜狗的翻譯之路正越走越快。

或許有理由相信,接下來占據“翻譯+”這個優勢的搜狗,會進駐和顛覆更多硬件獨立場景。完成從軟件到硬件的區域戰爭,將AI技術落地帶到更多戰場上。而隱藏在“機器翻譯方案+硬件生態”背後的,是搜狗AI技術壁壘的不斷加固與轉化。

作為能源的AI,可能準備好了打一場世界大戰

抽離到更高層級,我們可以看到硬件和軟件的產品之上,是搜狗正在基於機器翻譯、語音識別、NLP、知識圖譜等世界領先的技術積累,源源不斷構建垂直解決方案,將能力輸送到一個又一個硬件和軟件場景中。在這背後,是技術壁壘的紅利持續發酵。

技術分享圖片

舉例來說,搜狗語音輸入日頻次高達3.6億次,其基於T級海量輸入法文本數據使用神經網絡進行建模,語音識別率高達97%,保持著目前的世界記錄。而在機器翻譯領域,搜狗在去年的AI頂級賽事WMT2017中獲得了中英機器翻譯冠軍,並獲得主要機器指標BLEU第一名。

對AI技術的持續探索和積累,尤其是基於語音與語言的AI技術體系,比如NLP、語音識別、機器翻譯、詞意分割等等,正在構成相互間緊密聯系的AI技術引擎。更重要的是,在AI滲透到各垂直市場的檔口,由於搜狗掌握了整個技術到產品的IP流程,不需要支付高昂的使用費用,這也讓搜狗可以快速以消費級姿態切入各細分場景。以AI作為能源,調用多種能力組合創造新物種,可以看做這個時代的一場無限叠代。而搜狗已經開始了這場面向未來的探索。整個社會都在講AI作為能源,而從錄音筆從工具到服務的個案上可以看出,搜狗已經啟動了AI作為能源的垂直場景進駐之旅。

下一個被顛覆的硬件是什麽,或許才是我們今天應該感興趣的話題。


局部戰爭還是全面入侵?如何看待搜狗錄音翻譯筆?