國產手機的AI視覺革命
最近,在仔細琢磨了兩大巨頭蘋果和谷歌釋出的旗艦手機之後,老冀對國產手機的未來前景有了一份擔憂。
從表面上看起來,現在國產手機是形勢一片大好:全球前10大智慧手機廠商中有7家國產廠商,前5大中則有3家國產品牌,這3家加起來的市場份額已經超過了三星+蘋果兩大國際品牌,有什麼好擔憂的?
AI加持下的視覺應用:手機的未來戰場
殊不知正所謂“盛極必衰”,尤其是“盛世”的基礎並不牢固的時候。舉個別的行業的例子。2003年年底的時候,中國彩電行業可謂達到了頂峰,當時TCL通過收購法國湯姆遜的彩電業務成為僅次於三星的全球第二,康佳、長虹、海信、創維等其他國產廠商也都如日中天。結果呢?隨著彩電從CRT向LCD的技術變革,國產彩電廠商很快又被韓國廠商拋在了後面。
其實,當年國產手機也經歷過同樣的事情。2012年的時候,國產手機中湧現了中華酷聯、天宇、金立等眾多知名品牌;而到了今天,除了華為仍然傲立潮頭之外,其他國產手機品牌集體掉了隊。
因此,老冀認為,雖然目前國產手機看似不錯,實則面臨技術升級的巨大挑戰,而這個挑戰來自於一項偉大的技術變革,它就是人工智慧(AI)。
實際上,從蘋果和谷歌釋出的智慧手機新品上,我們已經看到了AI的巨大威力:iPhone X將3D結構光與AI緊密結合起來,實現了3D頭像和刷臉支付,併為AR/VR應用做好了準備,而國產手機直到一年之後才推出了類似的功能。谷歌前不久剛剛釋出的Pixel 3,雖然只搭載了一顆1220萬畫素的後置單攝,卻能夠藉助谷歌獨有的AI能力,拍照水平照樣吊打眾多配備了雙攝甚至三攝的國產旗艦手機。
這說明了什麼?說明智慧手機的競爭焦點已經從國產手機廠商最擅長的堆砌硬體、美化UI、追求價效比轉向了AI能力。老冀認為,如果國產手機廠商到現在還沒有認識到AI的重要性,下一輪又將集體掉隊。
老冀注意到,10月19日,知名研究機構IDC聯合曠視科技釋出了一份白皮書《AI+手機:“視”界革命》(以下簡稱“《AI+白皮書》”)。IDC對中國2018年上半年出貨量前100名的手機型號(佔中國上半年智慧機出貨量的91%)共計1.6億部手機進行分類統計,其中提供AI功能的手機佔比已經接近90%。這也說明,AI手機正在成為市場主流。
那麼,AI在智慧手機上都有哪些應用?《AI+白皮書》的消費者調查發現,視覺應用(包括美顏、夜景攝影、立體成相、增強現實等)是手機AI應用中最主要的訴求。
2017年《IDC Consumerscape 360°》調研更是顯示,51%的使用者會將拍照作為購買手機的七大選擇因素之一。
視覺應用的“關鍵四環”
由此可見,視覺應用正在成為提升使用者體驗,影響使用者購買行為的重要指標。那麼,在這場關係到未來的AI視覺應用的競爭中,國產手機如何才能把握住自己的命運?
《AI+白皮書》認為,想要給終端使用者帶來超預期的視覺體驗,需要產業鏈的協同發展。視覺技術的推陳出新,與產業鏈的發展緊密相連,“應用”、“演算法”、“解決方案”、“硬體”這“關鍵四環”中任何一環的短板都會使技術創新的價值大打折扣。下面,讓我們具體看一下這“關鍵四環”都是什麼:
1. 應用:目前主要包括識別與認證、AI攝影、3D感知。此外,通過3D鏡頭(感測器)、增強演算法、算力(AI晶片)和視覺解決方案的整合,AI手機可以實現美體、整形、虛化、光效、超級夜攝、標籤等多種拍攝功能,讓使用者使用手機就可以拍出來專業相機和專業攝影師的水準,拓展更多創造性的應用。
2. 演算法:演算法是應用的靈魂,演算法的優劣決定著應用體驗的差異。目前,計算機視覺普遍採用基於深度學習的演算法,它彌補了手工設計特徵的缺陷,非線性變換可以做非常多次,特徵表示能力顯著提高,並且可以自動地訓練所有引數,大幅提升了視覺演算法的效率。此外,手機由於受到成本、外觀、電池容量、供應鏈等多種因素的限制,需要保持效能、體驗和價格的平衡,這對演算法提出了更高的要求。
3. 解決方案:解決方案層更多地是為硬體層提供支撐。隨著視覺應用的場景化,不同的場景需要不同的視覺解決方案,底層演算法需要根據不同的應用場景提供深度計算、深度修復、深度優化、標定、畸變校正等不同的能力,並針對雙攝、三攝、深攝等不同光學器件提供個性化的優化方案。
4. 硬體:當然,所有的視覺應用都必須具備相應的硬體才能實現,如晶片、模組、感測器、光學元件、結構光器件、TOF器件,等等。
正如《AI+白皮書》所言,超預期的視覺體驗需要產業鏈的協同發展,尤其需要國產手機廠商和上游AI廠商的通力合作。所幸的是,在大眾創業、萬眾創新的大環境之下,中國本土已經崛起了一批包括曠視科技在內的優秀AI廠商,他們正在與國產手機廠商、世界領先的晶片廠商及光學器件、模組廠商通力合作,一起打通視覺應用的“關鍵四環”。
AI廠商助攻國產手機
老冀注意到,近日第一手機界研究院釋出了手機戰報,OPPO Find X成為8月中國手機市場上4000元以上最暢銷的安卓手機。要知道,OPPO Find X是安卓陣營第一款真正意義上量產的搭載3D結構光的手機,同時支援3D人臉解鎖和3D人臉支付,一舉拉高了安卓旗艦手機標準。
OPPO Find X手機上的人臉識別應用,就是曠視科技與OPPO研究院上海軟體研究中心AI實驗室通力合作的結晶。搭載曠視科技3D結構光人臉識別方案的OPPO Find X可通過前置的RGB、紅外和結構光攝像頭同時採集到人臉的色彩圖片、紅外圖片和3D資訊,並快速從輸入的人臉紅外特徵資訊與深度資訊中提取個人的安全識別特徵,安全特徵具有10000+的維度資訊,演算法會將提取的安全資訊與錄入時的安全資訊進行匹配決定是否安全認證通過。在體驗上,錄入和解鎖都可以在0.1秒內完成,誤識別率低於百萬分之一,且幾乎不受暗光環境影響。而在安全性上,曠視給出的3D結構光人臉識別方案無論是在解鎖還是支付應用中都可以有效抵禦照片、視訊甚至定製化矽膠面具和3D列印面具等形式的攻擊。
再舉另一款最近大賣的國產手機vivo X23的例子。這款手機有一項廣受歡迎的功能——“AI人像”。為滿足對人像影像處理與光效運用的更高要求,完善二維人臉重建帶來的人像處理不足,vivo X23採用了基於上百萬張覆蓋全人種的人臉資料訓練的升級版AI人像光效處理技術,並新增倫勃朗光與彩虹光兩款定製光效。在實際體驗中,vivoX23採用的AI人像光效處理技術在完成智慧打光的同時,保護人像畫面的鬍鬚、眉眼、脣部和背景等必要細節,使其不會因為打光而削弱或變色,人像虛化過渡更自然。
此外,曠視的 AI 視覺解決方案還能滿足對使用者面部的光線檢測、T區高光提亮以及對區域性陰影的處理,即使在逆光環境下也能讓人像處理更立體。以倫勃朗光為例,在布光時從人像側前方45°向面部打光,以勾勒人物,突出人物的立體、深邃感,並且在打光同時,手機能對原始畫面中的面部進行左右臉的光強、光源、大小分析,從而判斷出光到底該從左打還是從右打,做到智慧布光,讓使用者輕鬆駕馭自然的光,通過簡單的手機攝影便能享受影棚體驗。