聲智科技:AI遠場語音領跑者
人工智慧時代,語音互動被視為使用者多場景下的主要流量入口之一。而真實的聲場環境下, 遠場語音技術的突破成為了解決諸多複雜問題的關鍵。
“‘遠場語音互動’,是我們提的第一個概念。遠場是所有技術的集合體,包括聲學技術、喚醒技術、端點檢測技術,和大家比較熟悉的語音識別、語義理解、語音合成等,這些內容關聯在一起,才能解決使用者遇到的問題,為使用者創造價值。它意味著實現真正的、自然的人機互動,在人和人之間正常互動的距離內,可以真正釋放雙手。” 北京聲智科技有限公司創始人、董事長兼CEO 陳孝良對《世界經理人》說。
基於技術發展的階段、市場的需求和自身的能力,陳孝良於2016 年創立了專注於聲學語音技術和遠場智慧互動的聲智科技。在此之前,陳孝良一直擔任中科院聲學研究所的副研究員,是名工學博士。為了讓所學能造福更多人,他和他的團隊毅然踏上創業征程。
強大的技術背景,讓聲智科技在創立不久後就獲得資本青睞,還贏得了與百度、小米等巨頭公司的合作。在這個競爭激烈的賽道上,作為一家新銳的創業公司,聲智科技找到了自身的生存之道。
找準切入口
相較於擁有大量資料資源的巨頭企業,創業公司更多的是通過深耕垂直賽道來實現自我成長。在商業化的探索中,聲智科技找到了一個絕佳的切入口—智慧音箱。
根據Canalys 資料顯示,在2018 年四個季度, 全球智慧音箱出貨量分別達到900 萬臺、1680 萬臺、1970 萬臺和3850 萬臺,同比增長分別為210%、187%、137% 和158%。智慧音箱市場潛力不容小覷。
“從這兩年的市場表現來看,智慧音箱是全球最成功的人工智慧產品,是使用者真正願意付費購買體驗的一款智慧裝置。智慧音箱在全球以及中國的市場快速出量,驗證了聲智科技當時的選擇。”陳孝良說。
不過,當前中國很多技術還在爬坡階段,中國的智慧音箱出貨量還未達到預期。陳孝良表示: “從藍海到紅海的轉變期有些長,這是留給創業公司的一個視窗期,但所有新興的藍海市場剛開始必然是需要培育的,而創業公司也要承擔更多。雖然我們在智慧音箱領域做得很多,但我們一樣需要對不在聲智科技核心體系內的很多事情做好支撐。”
目前,聲智科技在全力開拓智慧音箱市場的同時,更多的精力集中在開拓新的業務體系。其主要面向B 端提供遠場智慧互動系統SoundAI Azero 和開放平臺服務,以及深度結合應用場景的 人工智慧技術 和產品解決方案。
“當新興市場開拓後,很快就會由藍海市場變成紅海市場,這時要保持一定的競爭策略。我們會不斷開拓新市場以及在傳統市場中用‘ 智慧+ ’的方式進行升級,不斷積累並做好技術與 使用者體驗 優化。去年聲智科技已經開拓了一些行業市場,比如,運營商市場、金融市場。”陳孝良表示。
使用者體驗為先
遠場語音技術需要解決多重複雜問題。舉一個典型的例子,使用者在房間中人機對話,會產生混響, 需要去混響的演算法;有環境噪聲,需要噪聲抑制的演算法;音箱在唱歌的時候,需要自噪聲抑制的演算法;使用者每說一句話需要加標點符號,需要端點檢測的演算法;叫智慧裝置的名字,需要語音喚醒的演算法;識別不同使用者身份,需要聲紋識別的演算法等等。
通常來說,以上諸多問題是使用者體驗智慧裝置是否“智慧”的關鍵所在,而技術則是其中最重要的能力之一。“我們非常關注這兩點:第一是解決產品在真實場景的應用,第二是解決為使用者服務的問題。這需要技術架構把聲學和機器學習的方法融合在一起,這也是聲智團隊成員比較擅長的。凡是使用者體驗關注的東西都需要我們花很大的精力去解決。”陳孝良說。據瞭解,聲智科技很早就重視喚醒率以及誤喚醒率,包括識別遠場,尤其是3-5 米的對話距離。
然而,這不僅僅只是純粹技術的問題,也有工程階段能力的問題。“比如如何將差異為1DB 或3DB 的感測器與產品完美融合,就需要建立一套標準的規範、測試條件以及量產時檢測的方法。這需要聲智科技付出很多包括聲學結構的設計指導工作。聲智科技的運營拓展部門,主要負責將研發技術真正落地到規模化生產。比較幸運的是聲智科技的第一項技術3 個月後就應用在量產產品中了。前期的過程對我們是非常大的考驗,但也是一個非常好的鍛鍊機會,讓聲智科技能獲得快速生產的驗證機會。”
敏捷管理模式
聲智科技團隊分工明確,如做軟體的有UI 方向、演算法方向;做演算法分為聲學演算法、深度學習等, 還有做語義、做雲端平臺架構、做交付,以及做晶片系統開發等。這些差異明顯的眾多團隊聚合發展,如何才能發揮協同效應?
陳孝良的答案是“敏捷管理”。“我們有一個比較重要的管理創新,也就是長鏈研發的敏捷管理。採用長鏈研發的敏捷管理模式,強調基於人才的場景管理,關注點會著重放在目標和進度的管理。”
與傳統的目標管理中任務附帶強KPI 考核性質不同,聲智科技將整體戰略目標分解到每個團隊,且不將其和薪酬緊密掛鉤。以“大平臺+ 小團隊”的敏捷管理模式,告別單一KPI 或OKR 導向,以期在其中找到平衡,尋求一種面向未來的新型管理方式。
“管理模式創新是我們一直在探索的,企業需要根據不同的人群使用更靈活、人性化的管理方式。希望我們的員工在未來的行業中能成為領軍人物, 這是我們培養人才的出發點之一。大家是不是把它當成自己的一份事業來看待,而不僅僅是一項工作, 這是很重要的一件事。我們希望在人工智慧領域有所作為,這是聲智科技所有的管理方式能順利推進的重要參考點。”陳孝良表示。
圖 / 陳孝良