揭祕手機行業未來AI之路
在10月19日上午舉辦的IDC中國數字化轉型年度盛典的“人工智慧與大資料”分論壇上,IDC(國際資料公司,International Data Corporation)聯合曠視科技釋出“AI+手機”行業白皮書報告——《IDC手機行業白皮書:“視”界革命》(以下簡稱“報告”)。下面,智慧菌就對AI手機報告和AI手機的發展做詳細梳理。
一、智慧手機行業已經進入轉折點
手機是承載人類數字化生活於工作最重要的裝置,更是近20年來對人類社會改變最大的工具。移動網際網路的蓬勃發展,讓手機從單純的通訊工具成為人們生活和工作的入口。未來手機不僅將成為我們身體的延伸,更將幫助人們簡化生活、分擔工作,成為人類的“個人智慧助理”。
經過十年的黃金髮展期,2017年智慧手機行業遇到了發展的重要轉折點。根據IDC的統計資料顯示,2017年全球智慧手機出貨量為14.7億臺,同比下降0.3%。首次出現同比下跌的情況。而中國市場的變化趨勢更為明顯。2017年,中國智慧手機出貨量為4.4億部,同比下降4.9%。這意味著傳統的智慧手機市場已經呈現飽和,手機廠商必須從拼銷量、拼價格向拼品質、拼體驗轉型。
二、何謂真正的“AI手機”
據報告顯示,從2017年開始,越來越多的手機廠商意識到了AI給智慧手機行業帶來的價值,紛紛推出了“AI手機”,2018年主流手機廠商更是在各自的旗艦機型中全面引入AI技術,甚至搭載AI晶片的手機正在成為市場的主流。
不過,目前的“AI+手機”還處在較為初級的階段,很多的功能應用還具有侷限性,只是在部分特定場景下才能發揮作用,距離真正的AI手機普及還有不小的技術門檻。
曠視科技副總裁謝憶楠對目前的“AI手機”發表了看法,他認為,現在很多的手機還不能叫“AI手機”,更多應該稱作“AI Camera”。現在AI應用提升較多的是在攝像頭上,無論是拍照、解鎖,還是認知、優化、分析等都是基於這個“AI Camera”。最淺層的AI Camera即人臉解鎖,再往上則可能是AI的智慧優化。
三、計算機視覺給手機帶來的三大應用方向和三種解決方案
視覺應用是手機AI應用中最主要的訴求。在2017年《IDCConsumercape360°》調研中,當你購買手機時,影響你採購決定的七個最重要的因素,73%的使用者會考慮電池續航時間,51%的使用者考慮拍照效果。
從圖中我們可以明顯地看到,目前主流的手機應用大多與視覺應用相關(藍色柱狀圖),可以說,提升視覺技術在當前是改善使用者體驗的最直接和最有效的手段。
目前,AI手機基於計算機視覺開發的人臉解鎖、人像美顏功能在手機應用中滲透率分別高達75%與90%。與此同時,AI視覺需求的日益強烈對產業鏈因此提出了更高的要求,應用、演算法、解決方案、硬體將會環環相扣、缺一不可。
想要給使用者帶來超預期的視覺體驗,需要產業鏈的協同發展。視覺技術的推陳出新與產業鏈的發展緊密相連。IDC將計算機視覺技術對安手機的影響分為四個層面,每一個層面的創新既相對獨立又相互促進。利用新器件、新演算法打造新方案探索新應用,改善使用者體驗,提升使用者粘性是AI手機快速普及的重要助推力。
從上圖可以看到,計算機視覺技術在手機種的應用主要可以分為三大方向:識別與認證、AI攝影、3D感知。
1、識別與認證。通過高效的人臉識別演算法,手機可以實現毫秒級的人臉解鎖和金融級的人臉支付。目前,這項技術在手機上已經廣泛應用於網際網路金融風控、共享出行司機和乘客驗證、社保等行業,用於甄別欺詐行為。
2、AI攝影。人工智慧可以智慧分析出使用者的年齡、膚色、體型等特徵,通過人臉檢測、關鍵點檢測、場景識別等AI演算法對畫質進行精準提升,讓成像更加自然,為使用者帶來更完美的體驗。
3、3D感知全棧方案。IDC認為3D感知將實現計算機視覺在手機領域的重大突破,為手機應用打開了更為廣闊的空間,例如AR遊戲虛擬、試穿等應用。但是,目前基於3D的感知應用還不普及。
以上這些應用都離不開攝像頭上的解決方案,目前市場上的方案有雙攝、三攝、深攝三類方案。
| 目前市場上的雙攝方案主要分為三種:
1、景深方案。一般是採用兩枚畫素不同的感測器來進行拍攝,主攝像頭畫素極高,負責拍攝整體畫面副攝像頭畫素稍低,負責記錄景深資訊。主要賣點是突出主體,背景虛化。
2、黑白+彩色方案。利用兩枚後置攝像頭在結構上的細微差異,經演算法融合呈現優於傳統單枚攝像頭的成像效果,可以有效提高畫素細節相近,顏色的過度也會更加自然。整體在層次感上有著不錯的提升,它的最大賣點是成像更加清晰,適應夜拍。
3、定焦雙攝方案(廣角+長焦方案)。在不同的光照條件下,手機能夠自主選擇合適的攝像頭來進行自拍。在光線充足的場景中選用長焦鏡頭進行拍攝,並且能實現兩倍無損變焦。當光線不足時則啟用廣角鏡頭為主攝像頭,能更好地保證亮度,主要賣點是變焦拍攝更容易。
| 三攝方案也主要分為三種:
1、在彩色鏡頭+黑白鏡頭基礎上,加長焦鏡頭的組合。擁有高倍無損變焦能力,能夠在低光效能變焦高解析度,景深,虛化等方面提供更優質的體驗。
2、在彩色鏡頭+黑白鏡頭基礎上,加入一顆COMS輔助成像,能夠帶來更好的寬容度。
3、在廣角+長焦的方案的基礎上,加入一顆魚眼鏡頭,實現超級變焦功能,提供更多視角。
總之,三攝可以同時具備光學變焦及黑白鏡頭無損遠攝的同時,還能夠利用黑白鏡頭的補光優勢保證更出色的成像質量,這就為人像模式等需要模擬大光圈背景虛化的場景提供了更多可能性。彌補面部曝光不足的同時,多一顆攝像頭就有可能得到更全面的景深資料,從而讓背景虛化更加完美。
| 深攝攝像頭按技術分類可以分為以下三類:
1、主流技術。
2、雙目結構光。
3、飛行時間演算法(TOF)。
四、AI視覺方案對手機產業鏈的革新需求
隨著人工智慧視覺需求的日益強烈,AI視覺解決方案整合將加速,對產業鏈提出了更高的要求。
首先,隨著AI應用場景的不斷擴充套件,視覺應用需求更加強烈,但是過於複雜的產業鏈將延長開發週期,抑制性應用的快速商用,同時,過高的門檻將大大提高應用的成本。
其次,由於手機設計的特殊要求,如輕薄,省電,產品迭代快,使用環境多樣化等。要求產業鏈可以根據手機廠商需求,提供端到端的一站式解決方案。可以高效定製於快速迭代視覺技術的產業整合勢在必行。
報告指出,計算機視覺技術封裝將成為手機產業鏈的關鍵環節,可見計算機視覺技術在手機領域的應用正在趨於成熟,但就技術本身來講還有太多應用場景尚未被開發出來。當前市場關注度、滲透率及技術採用度相對較高的應用場景,如人臉識別、物體識別、物體檢測等還停留在較為基礎的物體探測階段,在更具體的事件檢測、更靈活的人機互動及更復雜的資訊重組、自主行為等方面的應用明顯不足。
目前,AI視覺產業生態的整合正在發生。以高通、聯發科、紫光展銳等公司為代表的晶片廠商,以及以奧比中光、艾邁斯、舜宇光學、歐菲科技為代表的光學器件和模組廠商正在通過戰略合作資本等形式與上層演算法和應用公司進行深度合作。
報告預測,未來AI視覺產品的生態將更加聚合,從單一的產品競爭將向平臺生態轉變,只有多方供應商緊密配合,才能將使用者體驗做到極致。並且,擁有生態平臺的企業才能在行業洗禮中脫穎而出。
未來,無論是計算機視覺技術本身還是“AI手機”行業的市場前景,都還具有非常大的想象空間。
五、如何面對AI手機發展帶來的問題
AI在行業落地的關鍵,是要找到AI與這個行業的重合點是什麼,以及能夠解決的行業的潛在或顯著性問題是什麼。
談及使用者資料保護問題,謝憶楠分享了曠視科技的做法。他說,公司從最開始就通過“資料脫敏”這種不可逆的方式進行資料保護,假設發生資料被竊,在沒有拿到演算法的原始碼的情況下也不可能把脫敏後的資料還原成人臉,這樣它對使用者隱私造成的影響就不大。曠視是一家提供技術服務的平臺,做人臉識別對比之後只會反饋一個相似度的結果,並不做資料的儲存。
在談及未來AI手機的發展,謝憶楠認為,資料的缺乏是一個很大的問題,因此有兩件事情要解決,首先是在時間上,能否快速地通過一小部分的資料直接產生標註,其次則是資料標註如何“去人力化”的問題。
未來智慧實驗室是人工智慧學家與科學院相關機構聯合成立的人工智慧,網際網路和腦科學交叉研究機構。
未來智慧實驗室的主要工作包括:建立AI智慧系統智商評測體系,開展世界人工智慧智商評測;開展網際網路(城市)雲腦研究計劃,構建網際網路(城市)雲腦技術和企業圖譜,為提升企業,行業與城市的智慧水平服務。
文|網易智慧