助力 AI 產業落地,雲知聲展示全棧 AI 硬核技術
繼北京站之後,4 月 18 日,雲知聲開放日(Open Day)第 2 場來到深圳。本次雲知聲開放日聚焦 AI 技術、應用和產業,雲知聲董事長/CTO 樑家恩博士與多位雲知聲技術專家向深圳的合作伙伴、行業人士全面的秀出了全棧 AI 硬核技術,並與騰訊傑出科學家/騰訊 AI Lab 副主任俞棟、攜住科技聯合創始人葉明、同行者科技聯合創始人葉維、金鷹卡通衛視產品總監戴文博、三諾聲智聯副總經理喬嶠等多位嘉賓,剖析了 AI 技術在酒店、車載、教育等領域的應用及落地。
全棧:技術能力全棧,產業服務全棧
樑家恩博士作為人工智慧行業的資深從業者,在現場與我們覆盤了發展歷程,他表示,在 AI 大潮退去之後,技術的產業化能力成為了決勝的關鍵。技術如果不能解決產業問題,那麼技術將化為企業「炫技」的產物。基於此,樑家恩博士將雲知聲的 AI 哲學概括為「全棧」和「硬核」。

「全棧」包含了全棧 AI 技術能力和全棧 AI 落地能力兩個維度。經過多年的發展,目前,雲知聲的 AI 能力已經超了單一的語音技術,覆蓋了 Atlas 機器學習超算平臺,訊號、語音、影象、文字的感知和表達能力,知識、理解、分析、決策等認知技術,並朝著多模態人工智慧系統方向發展。同時,雲知聲通過將能力封裝在自研 AI 晶片之上,打磨了「雲端芯」一體化產品體系,推動 AI 技術在家居、車載、兒童、教育、醫療、金融、零售等多個領域實現落地,實現了從 AI 技術到產業應用的生態閉環。
硬核:確實、有效地解決產業規模化痛點
「硬核」,指技術方案能夠確實、有效地解決產業規模化痛點,為終端使用者提供相對成熟的使用者體驗。
以當時最熱門的智慧語音為例,經歷了兩年的市場教育,現如今,語音互動技術被廣泛應用到各大場景中,成為了 AI 技術落地最典型的應用案例。然而,在實際使用中,AI 需要面對的情況比實驗室中要複雜得多,一旦產品軟硬體的某一環處理不好,便容易出現「聽不到、聽不懂、答非所問」等問題。針對這類行業痛點,在本次雲知聲開放日深圳站現場,雲知聲的技術團隊從語音互動技術的拾音、識別和互動等維度,深度剖析了技術難點和解決方案。
在 AIoT 場景下,裝置首先要解決的便是遠場拾音問題。雲知聲 AI Labs 技術專家關海欣表示,解決遠端語音識別的關鍵在前端訊號處理階段,解決回聲、混響和噪音 3 大核心問題,以確保裝置可以準確識別到使用者指令。目前,雲知聲在回聲消除、混響抑制、噪聲處理等方向均已有成熟的技術方案,相關技術指標均達行業一流水準。另外,未來遠端語音識別還將呈現 DSP+DL 結合、分散式拾音兩大趨勢,對此,雲知聲也已經展開了相應的技術部署。

在語音識別階段,則需要在聲學和語言層面,賦予機器感知並語音指令的能力。雲知聲 AI Labs 技術專家李軼傑表示,聲學方面,雲知聲基於大資料、前言聲學建模、機器人自適應學習搭建了聲學模型;在語言層面,雲知聲建立了一個數據規模大、融合能力強、靈活和個性化的語言模型,以上模型在還將基於超算平臺不斷優化迭代。此外,雲知聲還將其語音識別能力延展到語音評測、聲紋識別、情緒識別等多個方向。

在對話階段,圍繞更加自然的人機互動,雲知聲打造了流式互動、語用計算與知性會話 3 大硬核能力。雲知聲 AI Labs 技術專家單波介紹到,流式互動最大的特點是在多輪對話免喚醒,大大的提升了人機對話過程中的流暢程度;語用計算則是將人機對話內容放置到對應的語境中,讓裝置準確的理解人的意圖;最後,知性會話則是通過將知識圖譜應用到人機對話過程中,讓裝置準確的響應使用者的問題。

基於上述技術,2013 年,雲知聲面向合作伙伴開放對話技能開放平臺(語義雲),幫助合作伙伴打造更加自然的人機互動體驗,同時在實踐中不斷提升語義解析能力。目前這一平臺已經支援 200 多個的對話內容,覆蓋通訊、休閒娛樂、醫療健康、交通出行、裝置控制等多個場景,語義解析準確率高達 93%。
值得一提的是,語音感知與表達、語言與知識計算只是雲知聲硬核 AI 技術的冰山一角,目前,雲知聲硬核技術還包含了 AIoT 晶片、超算平臺與影象、翻譯拓展等。
落地:覆蓋酒店、汽車、兒童、音箱等場景
在大資料、深度學習、超算平臺的加持下,人工智慧底層技術將衝破閥值,帶來成熟的體驗,在技術和需求的雙重推動下,人工智慧將邁入發展的黃金階段,並掀起新一輪的 AIoT 產業變革。在下午的「智慧+」分論壇中,雲知聲副總裁康恆、雲知聲 AIOS 架構師郭洪光、與攜住科技、同行者科技、金鷹卡通、三諾聲智聯等多位合作伙伴,結合實際案例,深入探討了 AI 技術的在酒店、汽車、兒童和音箱等場景中的應用。
雲知聲副總裁康恆表示,在整個產業鏈中,AI 技術是個「基礎設施」,且這一基礎設定不可能在不加以定製的情況下適用全部場景。AI 在落地過程中,需要充分考慮使用場景和落地行業。基於對場景和產業的深度思考,2014 年,雲知聲便開始結合產業鏈,將雲知聲的 AI 技術賦能到個行業中去。

面向行業,雲知聲推出了一站式人工智慧平臺 UniOS。雲知聲 AIOS 架構師郭洪光表示,與同類產品相比,UniOS 具備開放、垂直兩大特性,其中,開放指的是雲知聲面向行業和合作夥伴開放技能平臺和裝置平臺,並在此基礎上相容第三方 AIOS;垂直則代表 UniOS 會針對特定的行業需求輸出解決方案,以此來幫助產業轉型。

攜住科技聯合創始人葉明跟我們介紹了 AI 技術在酒店場景中的應用案例。葉明表示,針對酒店場景,攜住科技基於 AIoT 技術,通過多種裝置聯動、場景定製,為酒店客戶帶來全新智慧互聯的場景體驗;另一方面,通過資訊整合和大資料分析,AI 還將提高酒店管理效率。

同行者科技聯合創始人葉維分享了 AI 語音技術如何助力汽車產業升級。葉維表示,在車載場景下,語音即為服務——語音是使用者與裝置、與網際網路連線的主要手段,承載了車聯網資源整合與使用者觸達的功能。因此,車載場景下的 AI 必須聚合豐富的內容和服務,並根據場景進行智慧匹配,打造千人千面的智慧化體驗。

金鷹卡通衛視產品總監戴文博分享了金鷹卡通對兒童產品智慧化的思考。戴文博指出,兒童和家長對智慧產品的需求與普通場景十分不同,基於此,金鷹卡通圍繞兒童場景的特徵,將 AI 技術與「麥咭」的形象做了深度整合,打造麥咭智慧親子智慧產品生態。

三諾聲智聯副總經理喬嶠從產品角度出發,與我們分享了人工智慧產品設計思考。喬嶠指出,人工智慧時代的設計方向是感知設計,產品只有將形狀、外觀、聽覺、觸感等諸多因素綜合成一個完整的資訊,充分調動人類的本能,才有可能設計出更普遍更通用的產品。

以帶屏音箱為例,螢幕為人機互動補充重要的視覺資訊,更加接近使用者本能,「未來 5 年,單帶屏的智慧音箱就會達到 3 億多臺,超過 PC 的規模。」