1. 程式人生 > >【語音智慧平臺】京東Alpha VS 訊飛開放平臺 (一)

【語音智慧平臺】京東Alpha VS 訊飛開放平臺 (一)

前言

語音助手作為一種便捷的互動形式,各家廠商一直很看好。

手機端的語音助手,比如蘋果的Siri、小米的小愛同學,一直在保持不斷進步。

智慧音箱作為除了手機之外的另一個重要的物聯網入口,也成為了兵家必爭之地,目前國內做的比較好的是小米的智慧音箱。京東也推出了自己的智慧音箱,京東叮咚智慧音箱。而為音箱提供技術支援的語音平臺,也開始發展。

訊飛作為國內領先的語音輸入法,在這個技術的基礎上,通過訊飛開放平臺,為其他廠商提供了一整套的解決方案。

之所以將這兩個放在一起對比,因為他們兩個都在推出AI技術服務。

京東Alpha

首先看看能做什麼

這裡寫圖片描述

loT開放平臺

Alpha-IoT 開放平臺是面向硬體廠家的一站式智慧硬體開發平臺

簡單概括下就是

  • 物聯網
  • 廠商級別的硬體接入

Skill開放平臺

Alpha技能的開發平臺,提供全套的自助式開發工具;幫開發者輕鬆,快速地將服務整合到Alpha平臺,

使使用者通過自然語言即可獲取服務,並通過Alpha賦能智慧裝置或手機應用,幫開發者獲得億級智慧場景使用者,

從移動服務向AI服務升級。

總結一下

  • 語音策略
  • 呼叫智慧硬體

AI賦能平臺

AI賦能平臺提供標準API/SDK,讓硬體開發者快速整合Alpha語音助手,實現產品智慧化

讓使用者通過語音來實現購物、聽音樂、查天氣等更多技能。

總結

  • 開發者的硬體整合Alpha語音助手

訊飛開放平臺

訊飛更傾向於提供解決方案和功能性質的API

這裡寫圖片描述

這裡寫圖片描述

從企業角度來講,這樣完整的解決方案更方便快捷。

從開發者角度來講,更傾向於提供給的API的功能。

開發者的介面

官方的來講下面的部分屬於完整的解決方案

  • 消費級產品
  • 醫療產品
  • 語音硬體

除了這些之外,能被呼叫的API類為

  • 語音合成
    • 線上語音合成
    • 離線語音合成
  • 語音識別
    • 語音聽寫
    • 語音轉寫
    • 實時語音轉寫
    • 語音喚醒
    • 離線命令詞識別
  • 語音擴充套件
    • 語音評測
    • 機器翻譯
    • 語義理解
  • 模式識別
    • 人臉識別
    • 聲紋識別
    • 手寫文字識別
    • 印刷文字識別

AIUI

AIUI相對於上面提到的比較傳統的介面提供,還是很不一樣的。

這裡寫圖片描述

同樣的,這裡也提到了技能這個概念。

這裡寫圖片描述

這部分也就是AI開放平臺的重要概念。

語音AI

看到這裡,你也就知道為什麼我會將這兩個平臺放到一起來講了。

語音AI平臺,就是用

  • 技能
  • 意圖
  • 預料
  • 實體

通過大量的訓練,來達到模糊語音輸入->精確匹配意圖->操作軟體或者硬體 的目的。

IBM的智慧助手也是這麼做的,只不過IBM目前不支援中文。

總結

我們通過大略的閱讀文件,瞭解了語音AI平臺的功能。

下面就是從結構角度,詳細看語音AI的設計思路。