五問要做語音版的 iOS 的驀然認知,如何打造語音互動應用閉環
11 月初,驀然認知上線了一項全新的服務—— ofollow,noindex" target="_blank">基於語音互動的電視版網易嚴選 。在此基礎上,使用者可以直接使用語音在電視上購買生活、家居、服裝等一系列用品。

實際上,「語音版嚴選」只是驀然認知的語音智慧應用生態中的冰山一角。目前,驀然認知已接入了 40+ 服務,覆蓋了內容、O2O、LBS 服務、電商及其他等 5 大類應用,從我們熟悉的查詢天氣、新聞,到叫外賣、買衣服、買電影票,再到加油、停車等等日常事項,都可以直接通過語音來完成。
用驀然認知創始人 & CEO 戴帥湘的話來說,驀然認知做的是將人們吃穿住行娛樂整個生態服務打通的連貫場景服務,為使用者提供全語音對話的智慧化服務。
對此,我們與戴帥湘聊了聊驀然認知對於語音互動中的應用、場景等方面的思考,以及如何打造語音互動應用閉環。
一問系統:打造語音版的 iOS
在多個公開場合中,戴帥湘表示,驀然認知想要打造的是,智慧語音界中的 iOS。成立之初,驀然認知創始人戴帥湘就提出了 DAAA(對話即應用)這一概念,即通過語音對話來分發服務,而 MorUI 就是這一分發機制中的引擎的入口。
為什麼是 iOS,為什麼不能是 Android?
面對這個問題,戴帥湘為我們列舉了 iOS 系統的幾大特徵:統一的應用形態、統一的賬號體系,以及多裝置間相互協作。在戴帥湘看來,這幾大特徵正是保證 iOS 良好的使用者體驗的基石。
而在語音互動中,要確保使用者有良好的使用者體驗,同樣也需要這幾大特徵——圍繞使用者不同時間段的需求,通過一個通用的超級賬號,將移動網際網路上的服務生態遷移到了客廳、汽車等多個場景中,為使用者構建全新 AI 服務生態。

正如蘋果通過一個 Apple ID 將不同終端上的應用和服務打通一樣,驀然認知也打造了一個基於手機號碼的賬號體系,通過一個統一的賬號,使用者可以多個裝置(如電視、汽車等)上登陸使用。如此一來,使用者既不需要再面對「記不住賬號密碼」的困難,裝置與裝置之間隔閡也得以打通,使用者在不同終端上的應用和任務都可以實現無縫遷移,實現跨終端的任務操作。
二問場景:打破家與車的空間壁壘
以語音互動最高頻使用的兩大場景——家居和汽車為例,以往大家在談「車家互聯」時,更多的關注點都在於如何打破家與車的空間壁壘,實現在不同空間場景下的裝置控制,比如讓使用者在車上控制家裡的智慧硬體、在家中對汽車進行控制實時監測。
隨著驀然認知統一的賬號體系的正式落地,「車家互聯」除了可以打破這一空間壁壘,同時也把使用者個人的應用和任務在各個空間場景做了一次無縫銜接。舉個例子,當用戶在家中的電視上購買了一張電影票,但因為時間來不及需要馬上出門,使用者可以直接離開並在手機上繼續完成支付流程;而到了車上,系統可以自動將電影院的地址在車機螢幕上顯示出來,並主動詢問是否要導航去該地;而在前往目的地的過程中,系統可以為使用者推薦目的地附近的停車場等。

值得一提的是,針對目前客廳等場景可能存在一個賬號可能對多個使用者的情況,驀然認知在手機賬號認證的基礎上,增加了聲紋識別認證,在需要查詢賬戶資訊、購物車或者支付等私密資訊時,使用者需要通過聲紋識別或手機 APP 方可檢視。此外,採訪中,戴帥湘還透露,未來,驀然認知還可能根據不同場景的需求,引入指紋、Face ID 等認證體系,來保障使用者的賬戶安全。
同時,基於這一賬號,驀然認知對於使用者畫像的精度也進一步得到了提高,並深化了 AI 對使用者的理解,為服務的「個性化推薦、千人千面」的決策智慧化保駕護航。
三問技能:打通技能與裝置、技能與技能的融合
目前,不管是國外的 Alexa 還是國內的語音平臺,大家都在做語音技能開放平臺,吸引各種開發者來提高自己平臺的技能數量和種類。然而,在驀然認知對語音技能數量並沒有那麼在意,戴帥湘認為,技能與裝置的融合、技能與技能之間的融合可以給使用者帶來更好的體驗。

在技能與裝置融合上,戴帥湘認為,同一個技能往往需要應用在不同的終端上,比如有用超大屏的電視、支援觸控的車機等,那麼在開發中就需要考慮儘可能的兼顧到不同裝置之間的相容和配適問題,讓應用在顯示和操作方式都保持一致,降低使用者在跨終端使用時的門檻,最大程度保證使用者體驗。
另一層面上,通過第三方打造的語音技能,技能與技能之間是相互隔離的,不能相互跳轉。戴帥湘舉了一個例子,Alexa 平臺上有兩個語音技能,一個是找餐館,一個是訂位置,理論上這兩個技能是可以相互融合的,但因為技能來自不同的開發者,使用者在找到餐館之後,需要先退出這個技能,在進入定位置的技能進行預約,在實際運營中,這一體驗並不流暢。
因此,驀然認知的做法是,把服務融合到驀然認知的系統中,並以一個完整的鏈條提供給使用者,打造更加系統化的服務。即,使用者在找到餐館後可以直接進入預定位置的服務中,而當預約時發現該餐館需要很長的排位時間,可以直接讓系統推薦類似的餐館。
四問技術:輸出全棧式技術,打造技術閉環
在系統層面,驀然認知表示,驀然認知已經掌握了語音鏈條上各個環節,包括:語義理解(NPL)、對話系統、學習系統、自動服務對接、語言生成、語音合成、聲紋識別、喚醒+離線命令詞、遠場降噪、語音識別等。
基於這一系列技術,驀然認知面向 B 端客戶輸出一整套完整的解決方案,並以開放、靈活、定製化的合作方式,為客戶提供一站式、軟硬一體智慧語音互動解決方案。

五問商業模式:聚焦家居和車載
「出於環境嘈雜和隱私等方面的考慮,國人通常不習慣在大庭廣眾之下使用語音,家庭和車載這兩個相對私密的場景可作為一個較為折中的切入點。」
這句話來自 一年前戴帥湘與深圳灣的對話 。彼時,國內市場「百箱大戰」如火如荼,BATJM 等網際網路巨頭爭相入局推出自家的智慧音箱。面對火爆的市場,戴帥湘在接受深圳灣的採訪時明確表示,驀然認知將主要瞄準兩類業務:電視和車載。
一年後,當我們重新看回當時與戴帥湘的這段對話時,驀然認知在家居和車載兩大應用場景中均已成功落地。在家居場景,驀然認知已經與康佳、TCL 等多家知名家電廠商達成合作,並擁有了不錯的口碑;在汽車場景下,驀然認知已與主機廠達成合作(但暫不方便對外公佈),預計 2018 年年底可以小批量試產。
而在未來,驀然認知想要做的,是構建全新的 AI 服務生態。基於驀然認知的自有全棧式語音 AI 技術,打通車與家之間的空間壁壘,實現語音互動應用閉環。