【語音智慧平臺】京東Alpha VS 訊飛開放平臺 (一)
前言
語音助手作為一種便捷的互動形式,各家廠商一直很看好。
手機端的語音助手,比如蘋果的Siri、小米的小愛同學,一直在保持不斷進步。
智慧音箱作為除了手機之外的另一個重要的物聯網入口,也成為了兵家必爭之地,目前國內做的比較好的是小米的智慧音箱。京東也推出了自己的智慧音箱,京東叮咚智慧音箱。而為音箱提供技術支援的語音平臺,也開始發展。
訊飛作為國內領先的語音輸入法,在這個技術的基礎上,通過訊飛開放平臺,為其他廠商提供了一整套的解決方案。
之所以將這兩個放在一起對比,因為他們兩個都在推出AI技術服務。
京東Alpha
首先看看能做什麼
loT開放平臺
Alpha-IoT 開放平臺是面向硬體廠家的一站式智慧硬體開發平臺
簡單概括下就是
- 物聯網
- 廠商級別的硬體接入
Skill開放平臺
Alpha技能的開發平臺,提供全套的自助式開發工具;幫開發者輕鬆,快速地將服務整合到Alpha平臺,
使使用者通過自然語言即可獲取服務,並通過Alpha賦能智慧裝置或手機應用,幫開發者獲得億級智慧場景使用者,
從移動服務向AI服務升級。
總結一下
- 語音策略
- 呼叫智慧硬體
AI賦能平臺
AI賦能平臺提供標準API/SDK,讓硬體開發者快速整合Alpha語音助手,實現產品智慧化
讓使用者通過語音來實現購物、聽音樂、查天氣等更多技能。
總結
- 開發者的硬體整合Alpha語音助手
訊飛開放平臺
訊飛更傾向於提供解決方案和功能性質的API
從企業角度來講,這樣完整的解決方案更方便快捷。
從開發者角度來講,更傾向於提供給的API的功能。
開發者的介面
官方的來講下面的部分屬於完整的解決方案
- 消費級產品
- 醫療產品
- 語音硬體
除了這些之外,能被呼叫的API類為
- 語音合成
- 線上語音合成
- 離線語音合成
- 語音識別
- 語音聽寫
- 語音轉寫
- 實時語音轉寫
- 語音喚醒
- 離線命令詞識別
- 語音擴充套件
- 語音評測
- 機器翻譯
- 語義理解
- 模式識別
- 人臉識別
- 聲紋識別
- 手寫文字識別
- 印刷文字識別
AIUI
AIUI相對於上面提到的比較傳統的介面提供,還是很不一樣的。
同樣的,這裡也提到了技能這個概念。
這部分也就是AI開放平臺的重要概念。
語音AI
看到這裡,你也就知道為什麼我會將這兩個平臺放到一起來講了。
語音AI平臺,就是用
- 技能
- 意圖
- 預料
- 實體
通過大量的訓練,來達到模糊語音輸入->精確匹配意圖->操作軟體或者硬體 的目的。
IBM的智慧助手也是這麼做的,只不過IBM目前不支援中文。
總結
我們通過大略的閱讀文件,瞭解了語音AI平臺的功能。
下面就是從結構角度,詳細看語音AI的設計思路。