AI 賦能 IoT 裝置進入衝量攻堅階段,可定製、體驗好、出貨快的方案仍然稀缺
毋庸置疑,在人機互動系統更迭引發的新一輪產業變革中,語音已成為裝置互動的最有效和最自然的方式。以 AI + IoT 為模式的物聯網裝置的智慧化浪潮,正在加速爆發。
國內語音智慧市場在經歷了一年多的大跨越式的發展後,逐漸進入了衝量的攻堅階段。儘管語音大平臺的賦能運動轟轟烈烈,但要把 AI 與現有 IoT 產品有機結合,把使用者體驗的成熟度做到產品級,仍有不小的挑戰。

一方面,對於許多產品團隊和傳統裝置廠商來說,技術能力不足,二次開發往往並不順利,導致產品交付無限制的延期;另一方面,對於平臺方來說,面對因為開放而蜂擁而至的長尾客戶,很難有精力逐一做好支援,賦能萬物難免的變成了平臺方和頭部品牌商的秀場。
雲知聲聯合創始人康恆博士在 9 月 12 日深圳召開的一場行業交流會上,分析總結了 AI + IoT 落地的 5 大挑戰:
1. AIoT 終端型別廣泛,從產品形態到功能再到使用場景,都呈現了明顯的碎片化的特徵,通用方案很難做到全品類的適配。
2. AIoT 終端裝置的供應商分散,除了晶片和硬體平臺之外,AI 演算法、運算服務、甚至應用程式,都需要多加供應商支援,這無疑加重了終端廠家的時間和財力成本。
3. 不可控的產品體驗。「攢」出來的產品,易造成不可控的使用者體驗。
4. 產品體驗的反覆調優,造成 TTM(產品上市週期)無法保證。
5. 方案不能在不同產品之間實現快速複製,造成成本高居不下。

在智慧音箱和智慧家居這個賽道上,可定製、體驗好、出貨快的語音 AI 方案,仍然是稀缺資源。
面對行業的難題,雲知聲推出了基於其首款 AIoT 晶片雨燕 SoC 的開源方案,以開放共贏的心態邀請裝置商、方案商和開發者,共同推動智慧音箱智慧家居產品快速智慧化。
為什麼要推開源方案?原始碼開放會到什麼程度?語音引擎原廠的 SDK 是不是就足夠了?開源方案適用於哪些行業使用者?價格和競爭力如何?針對這些問題,深圳灣在前不久採訪了雲知聲另一位聯合創始人李霄寒, ofollow,noindex">大家可以從這篇「十問」中獲得答案 。
這裡將著重講解,這一開源方案如何能夠解決裝置商、方案商和開發者在智慧化道路上面對的問題。

首先從晶片談起,鮑晴峰介紹了 雨燕 AIoT 晶片 架構的特點:
-
面向語音 AI 場景,提供 Audio IO,支援 6 個模擬/數字麥克風接入
-
擁有自主智慧財產權的 NPU (神經網路處理器) DeepNet
-
擁有自主智慧財產權的高效能數字訊號處理器 uDSP
-
採用基於 ARM 的通用 CPU,便於第三方應用開發
-
提供豐富的外圍介面:USB、SPI、I2S、SDIO、UART、GPIO等
相對於面向統一應用場景的通用 CPU,雨燕在 DSP 任務加速、miniNLP 任務加速、TTS 任務加速、記憶體頻寬利用效率、NN 任務提升等核心指標,都能有成倍數的提升。雨燕也被定義為是面向物聯網 AI 的入口級解決方案。

在硬體設計上,通過雨燕以及對應的硬體參考設計,去除了降噪模組和外部 ADC,降低整體成本和研發選型週期。
在系統層面,雨燕的開源方案基於嵌入式 Linux 建構系統,記憶體佔用小於 64M。關鍵器件(DDR & Flash & WIFI)提供至少 2 家供應商的驅動支援,以保證相容性。Wi-Fi 和 BT 具有不同播放協議(A2dp)和聯網方式(softAP, smartconfig)的支援,並對各種外部裝置做相容支援。
作為第三方語音平臺,雨燕開源方案的雲端服務,在可定製、可擴充套件性方面表現突出,支援多達 40 個領域的語義理解,支援客戶自定義的賬號系統和訊息中心,支援雲端快速定製 FAQ,支援第三方 skill 接入和第三方內容的整合。
同時,雨燕開源方案提供聲學結構參考設計,為產品提供結構設計建議,並派出語音訊號工程師和 FAE 團隊一起來調優聲學結構。

總體上,面向客戶、方案商與開發者,雲知聲為客戶提供全棧語音互動解決方案,包括完整的語音 AI 應用參考方案、雲端能力以及客製化工具。同時在靈活度方面,雲知聲提供了多種開源合作模式,以幫助客戶在跨形態的物聯網硬體產品上的差異化需求。
作為 AI 雲服務商、AI 軟體方案商、AI 晶片原廠,雲知聲希望用易用的 API、SDK 等開發元件,助力物聯網裝置商快速、高效地實現產品智慧化升級。
題圖來源:Wenxin Kou @Behance