1. 程式人生 > >【人工智慧】2017年中國人工智慧技術——智慧語音應用報告

【人工智慧】2017年中國人工智慧技術——智慧語音應用報告

2016年是人工智慧(AI)元年,智慧語音技術作為AI應用最成熟的技術之一,在智慧家居、智慧車載、智慧可穿戴領域有了迅猛發展。

鑑於此,科技巨頭、初創公司紛紛從不同維度佈局相關產業鏈,未來面向物聯網的智慧語音產業鏈的形成將引起商業模式的變化。

一、智慧語音技術取得重大突破,商業化落地成為可能

◈ 智慧語音技術是人工智慧產業鏈上的關鍵一環

人工智慧產業鏈主要分為三個層次。

底層是基礎設施,包括晶片、模組、感測器,以及以大資料平臺、雲端計算服務和網路運營商。這部分參與者以晶片廠商、科技巨頭、運營商為主。

中間層主要是一些基礎技術研究和服務提供商。包括深度學習/機器學習、計算機視覺、語音技術和自然語言處理以及機器人等領域。這一模組需要有海量的資料,強大的演算法,以及高效能運算平臺支撐。代表性企業主要有BAT、科大訊飛、微軟、亞馬遜、蘋果、facebook等網際網路巨頭和國內一些具有較強科技實力的人工智慧初創公司。

最上層是行業應用。大致分為2B和2C兩個方向。2B的代表領域包括安防、金融、醫療、教育、呼叫中心等。2C的代表領域包括智慧家居、可穿戴裝置、無人駕駛、虛擬助理、家庭機器人等。相關代表性企業既包括網際網路科技巨頭,也包括一些初創廠商。

◈ 中國人工智慧市場規模持續增長,智慧語音將居於重要地位

◈ 智慧語音技術成熟,商業化應用成為可能

深度學習、高效能運算平臺和大資料是人工智慧技術取得突破的核心助推力。深度學習端到端解決了特徵表示與序列影射的問題,使得人工智慧的效能得到了快速提升;而網際網路時代海量的資料又不斷為演算法模型提供了訓練材料,同時,雲端計算的興起和高效能的運算平臺為智慧化提供了強大的運算能力和服務能力。

在語音識別率方面,百度、谷歌,科大訊飛等主流平臺識別準確率均在96%以上,穩定的識別能力為語音技術的落地提供了可能。

◈ 商業場景落地的重要環節語音互動有了重大突破

與此同時,語音互動的核心環節也取得重大突破。語音識別環節突破了單點能力,從遠場識別,到語音分析和語義理解有了重大突破,呈現一種整體的互動方案。

二、智慧車載、智慧家居及可穿戴裝置風潮的興起加速語音技術落地

◈ 智慧語音市場整體處於啟動期,智慧車載,智慧家居,智慧可穿戴等垂直領域處於爆發前夜

◈ 智慧車載市場前景廣闊,預計五年內車聯網滲透率超過50%,語音將成為車載系統標配

我國是全球最大的汽車產銷市場,未來車載資訊系統市場將有廣闊的發展空間。Analysys易觀分析預測,到2018年,中國智慧車載市場規模將接近400億元,年均增長率超過70%,將保持高速發展狀態。

與此同時,車聯網程序加快,2015年,車載有屏裝置出貨量約1300萬臺,其中具備聯網功能的裝置滲透率僅為5%左右,預計伴隨著相關軟硬體適配效能的提升,以及車聯網產品服務逐漸完備,使用者用語音控制車載系統習慣逐漸形成,有屏聯網的車載終端產業將迎來爆發增長,未來5年內車載裝置滲透率將超過50%。

◈ 智慧家電滲透率提高,智慧家居市場蘊涵千億市場規模,語音作為家居互動入口將大有所為

語音互動正在改變家居生活習慣。2018年,中國智慧家居市場規模將達到1680億元。智慧電視是僅次於智慧手機滲透率最高的智慧家電單品,而智慧電視居於客廳位置的核心。也有越來越多的消費者習慣在沙發上使用語音換臺,語音作為智慧家居入口將有廣闊的想象空間。

◈ 可穿戴裝置市場規模潛力巨大,VR/AR、智慧手錶等興起,語音將成為天然互動入口

Analysys易觀估算,2018年可穿戴裝置市場規模將接近400億元,其中品類最大的是智慧手錶。近兩年,VR,AR的概念開始深入大眾,未來幾年相關硬體將呈現爆發式增長。而可穿戴裝置由於其特性所限,很難通過單一觸控實現流暢互動,因此語音互動成為剛需。

三、科技巨頭,初創公司紛紛從不同維度佈局相關產業鏈

◈ 國外科技巨頭:通過併購等手段,夯實核心技術,開放應用平臺,在既有的產品和業務中實現AI first,擴充套件以AI為核心的生態系統

在技術層,科技巨頭多推出演算法平臺吸引開發者,實現產品快速迭代,打造開發者生態鏈,形成行業標準。例如,谷歌通過一系列併購、開放平臺的建立,軟體硬體一體化來打造這個生態系統。

蘋果在自身生態系統中相繼推出面向可穿戴、家居、車載等領域的產品。亞馬遜則基於自身電商生態業務,推出智慧音箱,成功敲開了智慧家居的大門。

◈ 谷歌:延續既有開放模式,打造開發者生態鏈,推出Google Home,試圖建立物聯網時代安卓系統

在谷歌的AI first戰略中,一方面,推出人工智慧學習系統平臺TensorFlow,以吸引開發者,實現產品快速迭代,打造開發者生態鏈,形成行業標準;另一方面,推出谷歌家庭,試圖建立物聯網時代安卓系統。同時,將AI技術應用於其原有的產品中,比如Google輸入法、Google 翻譯、Google Now等,不斷提升產品效能,優化使用者體驗。

◈ 蘋果:基於智慧硬體定標準、做平臺、獲資料 ,重視物聯網時代生態控制權

與谷歌的開放生態不同,蘋果依舊延續了其既有的封閉系統,瞄準物聯網時代的生態控制權。同時,以硬體擅長的蘋果這次仍從佈局硬體起步,打造軟硬體生態系統,依靠其廣泛的OS系統使用者,再基於已推廣的OS系統拓展至物聯網產業鏈。

比如移動裝置方面,蘋果基於iPhone推廣到車載領域的CarPlay;可穿戴裝置方面,基於AppleWatch推廣HealthKit,以獲取使用者運動健康資料。

此外,還基於硬體定標準做平臺,比如在家居方面,蘋果搭建HomeKit平臺,吸引霍尼韋爾、飛利浦、海爾等各廠商的智慧家居硬體接入。蘋果希望打造物聯網時代完整的生態系統,並通過源源不斷的使用者資料,優化自身生態系統,提升使用者體驗。

◈ 國內網際網路巨頭:開放語音生態系統,以產業內合作的方式,將語音技術植入產品和或應用於相關業務場景,構建全產業生態鏈

在中國,以BAT等為代表的眾多網際網路巨頭也紛紛開發智慧語音市場。在語音生態系統方面,百度宣佈語音識別技術及能力全面開放。騰訊、搜狗語音開放平臺相繼上線。

在語音技術應用方面,各大廠商對家居、車載、可穿戴等環節的關注明顯升溫。智慧家居領域,百度釋出了Baidu ihome,阿里聯合智慧家電廠商推出天貓魔盒,搜狗聯手魅族,釋出魅族電視盒子。

智慧車載領域,百度分別推出了手機車機智慧互聯的產品Carlife,車的私有云服務平臺MyCar,和智慧語音人機互動方式的智慧行車助手CoDriver。

阿里雲和上汽合作推出車載作業系統,騰訊釋出了路寶APP+路寶盒子,可與騰訊雲連線,以實現車輛診斷、油耗分析、車友社交等功能。

搜狗則和四維圖新合作,推出飛歌導航。可穿戴領域,百度採取扶持外部產品,內建百度服務,形成開放生態思路:分別推出了Inside智慧硬體平臺,基於健康雲的Dulife智慧健康平臺,以及百度手錶應用,以吸引硬體廠商加入。

◈ 百度:瞄準人工智慧戰場,對外開放語音生態系統,對內在自身產品業務中實現AI First

百度是國內較早開放語音雲平臺的巨頭之一。對外主要採取開放自身語音生態系統的方式將語音技術輸出。

主要分為三個層次:第一,開放最底層的語音識別技術應用程式程式設計介面,開發者可以呼叫API實現語音識別功能。第二,向開發者提供開發工具包SDK,對語音識別標準化服務進行封裝,以便於最終對接服務和應用。第三,與硬體廠商合作,將語音技術植入硬體。百度希望通過這種產業內合作的方式逐步滲透到家居、車載等領域。

對內,基於百度大腦,將百度在語音、影象、自然語言處理和深度學習等方面的能力滲入到產品線中,並貫穿百度各項業務部署。比如手機百度依託深度學習演算法根據不同使用者的搜尋偏好進行使用者畫像,進行精準推薦。

在地圖和輸入法中也植入百度語音助手,將度祕機器人植入各類硬體,進一步提升使用者體驗。同時,百度的無人駕駛技術也處於領先地位。

◈ 國內智慧語音公司:依託原有優勢,從單一智慧語音技術商轉型全方位人工智慧技術服務商

在國內專注智慧語音技術的公司中,有兩家廠商值得關注。一家是科大訊飛,另一家是捷通華聲。這兩家企業在前期業務以運營商,金融等行業客戶和政府為主。後期開始發力智慧家居,智慧車載等領域。從單一的智慧語音技術商全面轉型人工智慧技術服務商。

但在商業化路徑上,有別於前述網際網路公司。他們仍採取的是傳統的“平臺嵌入”服務,即將自身語音技術植入相關合作夥伴的產品中,以推動智慧語音和人工智慧技術在家居、車載、可穿戴等領域的落地。

◈ 科大訊飛:傳統優勢明顯,未來將更注重通用人工智慧技術和平臺級業務的拓展

科大訊飛長期在教育領域擁有絕對優勢。除教育外,政府便民工程、呼叫中心和客服也是訊飛長期深耕的領域。

近兩年訊飛的重點關注的領域開始向移動網際網路和物聯網轉移。從業務佈局層面看,先後釋出訊飛雲平臺和人工智慧互動平臺AIUI,利用通用的人工智慧技術和平臺級業務,將語音識別、自然語言處理能力授權給第三方,或者與其他公司進行合作,並且開始向垂直領域拓展。

比如在智慧家居領域,訊飛聯合京東釋出叮咚音箱,2016年推出訊飛電視助理,打造智慧家居領域的入口級應用。在智慧車載領域,訊飛重點推出了飛魚汽車助理,將和奇瑞等汽車製造商合作,推進車聯網程序。通過源源不斷的垂直場景的資料,訓練“訊飛超腦”,推進人工智慧發展。

◈ 初創廠商:以垂直領域和細分場景為突破口,重點佈局家居,車載和可穿戴裝置

初創廠商在AI商業化上主要分為兩種路徑。第一種,開放API介面給第三方,軟硬一體化,走2B或2B2C路線。比如與家居廠商合作,將語音技術植入家電,以此切入智慧家居場景。或者從後裝車載市場切入,開發帶有智慧語音系統的後視鏡等。

這類代表廠商包括圖靈機器人、思必馳、雲知聲等。第二種,走軟硬一體化,走2C路線。從智慧手錶切入,逐漸擴充套件到車載,家居等場景,代表廠商有出門問問。

◈ 圖靈機器人:定位於語義和認知計算的平臺服務提供商,提供聊天機器人平臺和機器人作業系統

圖靈機器人是國內一款從中文語義起家的人工智慧技術服務提供商。目前的產品主要包括聊天機器人開放平臺—圖靈機器人平臺和人工智慧級機器人作業系統—Turing OS。

Turing OS能夠支援上下文對話、問答,以及Saas服務。在人工智慧技術落地方面,圖靈通過提供不同技術實施方案,為開發者提供多種場景化內容及AI能力,助力合作伙伴更快打造軟硬體智慧產品。

◈ 思必馳:專注垂直領域智慧硬體的語音互動解決方案

思必馳是國內一家專注於垂直領域智慧硬體的語音互動解決方案服務商。聚焦於2B領域的車載、家居和機器人等業務。推出了AIOS的智慧人機對話系統,並應用於家居和車載場景。此外,在此基礎上開放生態合作,共同推進智慧語音技術在垂直領域的落地。

◈ 雲知聲:聚焦物聯網,構建“雲端芯”產品戰略

雲知聲是一家專注物聯網人工智慧技術的服務商。商業化路徑是典型2B2C模式。通過與美的,格力等家電巨頭合作,將語音技術及AI晶片融入到相關產品中,藉助巨頭的渠道資源觸達終端消費者,並將資料來源源不斷地彙集到自身雲平臺中,迭代優化產品,提升使用者體驗。同時發力車載後裝市場,未來可能基於聲紋等特徵將車和家居的使用者ID打通,以此挖掘更大的資料價值,提供個性化增值服務。

◈ 出門問問:以可穿戴裝置為切入點,走以AI為中心的軟硬結合路線

與多數初創廠商不同的是,出門問問走了一條2C路線。以可穿戴裝置為切入點,走以AI為中心的軟硬結合路線。從一家純演算法公司,發展為全棧式創業團隊。

先後釋出了一二代智慧手錶,並進軍後裝車載領域,推出車載後視鏡。未來將會將場景拓展到家居領域,進一步打造移動終端、可穿戴裝置、車和家居的物聯網多屏聯動生態。

四、面向物聯網的智慧語音產業鏈的形成將引起商業模式的變化

◈ 未來趨勢:以語音為入口,建立以物聯網為基礎的商業模式

Analysys易觀分析認為,智慧語音的未來價值點在於使用者資料挖掘,以及背後內容,服務的打通。以語音作為入口的物聯網時代將會產生新的商業模式。

不同商業模式對硬體有不同的需求,廣告效果與螢幕尺寸有很大關係,因此在家居中,尤其是智慧電視為核心的場景下,廣告仍是一個主要收入來源。而可穿戴裝置、智慧車載等硬體獲取的大量資料在健康、保險等行業有巨大的價值,因而產生全新的商業模式 。

◈ 智慧家居:以合適的入口級應用為載體,基於萬物互聯的標準,將技術與硬體結合,實現內容和服務的拓展

Analysys易觀分析認為,找到合適的語音入口是挖掘智慧家居背後使用者價值的關鍵。硬體本身具有入口價值,智慧音箱、智慧電視、家庭機器人等都有可能成為合適的入口。通過前端語音互動提供入口,後端網際網路提供服務的方式完成物聯網時代家居場景下的商業模式轉換。

◈ 智慧車載:車聯網向縱深方向發展,硬體基礎功能免費,基於使用者資料的挖掘和增值服務將成為未來主要贏利點

Analysys易觀分析認為,語音互動在車載場景中存在剛需,也會成為最先爆發的領域。而車聯網的縱深化發展,將會衍生出硬體免費,靠個性化增值服務盈利的商業模式。

以汽車保險為例。以前車載場景痛點在於,車廠將車交給4S店,然後4S店賣給使用者。車一旦賣出後,車廠和使用者就失去了聯絡。而使用者買車後還會買車險,這部分又由單獨的保險公司介入,但是他們缺乏使用者用車資料,因此保費定價存在痛點。

而未來,車載裝置提供商可以通過補貼使用者來搶佔汽車內顯示屏市場,通過使用者用車行為資料的蒐集與挖掘,為保險公司和車廠提供資訊,保險公司根據資料設立分層級的保費機制,激勵規範駕駛行為。這樣,資訊流和服務流將不斷在生態系統中流轉,不斷挖掘更大價值。

◈ 智慧可穿戴:從單一售賣硬體獲得現金流,到後續通過內容和服務獲