1. 程式人生 > >借阿麗塔的慧眼,帶你一起看懂世界

借阿麗塔的慧眼,帶你一起看懂世界

大小 之前 勇敢 估計 人機交互 人臉識別 計算機 -o app

《阿麗塔·戰鬥天使》近日在中國內地上映,你有沒有和我一樣,被硬核少女阿麗塔美麗動人水汪汪的大眼睛迷倒?
技術分享圖片

“如果說眼睛是心靈的窗戶,那我們有非常漂亮的大窗戶——她的眼睛極其迷人有吸引力,展示了她內心的一切。”這是該電影的導演羅伯特·羅德裏格茲面對采訪時對女主大眼睛討論所做出的回應,言語中帶著些自豪。他還表示“用放大版的眼睛呈現一個漫畫角色”的設定,其實是源於詹姆斯·卡梅隆的堅持。

然而,創造出一雙這樣逼真的眼睛比我們想象的要難得多。電影的特效團隊通過CG技術在制作過程中嘗試過各式各樣的“眼睛”大小、間距、瞳孔大小、虹膜大小,光是眼珠“虹膜”就運用了830 萬多邊形數量的幾何建模,再從眼球壁到血管膜到視網膜每一層結構的制作和渲染,經過復雜的光路追蹤,最終將這雙眼睛呈現在觀眾面前。

技術分享圖片

圖片源於網絡

// 愛莫裏的大眼睛 //

在阿麗塔電影問世很久之前,愛莫的小夥伴們也創造出了一雙雙炯炯有神的眼睛,雖然這些眼睛沒有被搬上大銀幕,但他們的目標也是讓計算機能像阿麗塔一樣,更好地看見、看懂這個世界。先來看看這些傑作:

技術分享圖片

愛莫的小夥伴們創造的眼睛成為了讓神經網絡不斷進化升級的驅動力。

這些年無論是下圍棋無敵手的AlphaGo,還是比電視播音員發揮穩定的虛擬播音,都離不開人工智能領域最火熱的技術——深度學習。深度學習的效果非常棒,但“胃口”卻特別大,是被稱為Data-Hungry的“怪物”,沒有幾百上千萬的數據量,它都紋絲不動。

所以,嘔心瀝血的工程師們只能依靠大量的手工標註樣本數據來“打動”深度學習,人工智能變成了:有多少“人工”就有多少”智能”。

拿簡單的眼球跟蹤和視線估計問題來說,如果要給眼球周圍打上點,需要收集至少100萬張眼睛圖片,然後每天一人標註100張(絕對讓人 熱血澎湃 精疲力盡),團隊20人需要整整500天才能完成任務。標註眼睛點還算好,視線可就難了,一張圖片要把眼睛看的方向(α / β / Φ 角度)標註出來非常不容易,兩個人標註出來的結果都可能差別巨大。而數據標註工廠開價也不低,很多和愛莫一樣的創業公司必須精打細算用好每一分錢。

動手效率太低,愛莫的小夥伴們只能動腦了,雖然一直從事的是計算機視覺(以下簡稱CV)技術,這次必須求助於與CV相愛相殺的CG技術了。

愛莫通過自研CG引擎,對眼部結構、眼部紋理、肌肉肌理、運動模式等進行高精準建模,目的就是“以假亂真”,讓計算機和深度學習算法完成由虛(虛擬模型)到實(真實應用)的過渡。采用這種方式可以源源不斷產生數據,並且,這些數據還可以按需產生,眼球的轉向完全可控,使得數據分布非常均勻,訓練出來的神經網絡深度學習模型,就可以勇敢面對真實世界的所有場景了。

這樣的技術已經被團隊廣泛應用到 駕駛員狀態監測、人機交互、AR眼鏡、新零售用戶關註點分析等領域。
技術分享圖片
技術分享圖片
愛莫車載視覺管理應用案例展示

這些眼睛為愛莫的技術拓展帶來新思路,嘗到自動數據標註的甜頭,他們把CG引擎擴展到人臉3D渲染、身體3D渲染中去,對表情變化、光照變化、姿態變化等進行了高逼真的仿真,填補真實采集的數據分布不均的缺陷,同時大大減少了人力標註的成本,並且使得訓練出來的人工智能模型在與對手的pk中爭取更大優勢,特別是在處理“疑難雜癥”上,優勢更為明顯,比如在人臉識別中,因為對不同角度和光照條件都進行了很好的模擬,可以輕松完成大角度、復雜光照環境下的人臉準確識別。

// 愛莫算法Demo //

技術分享圖片
愛莫在線人臉比對結果(輸入人臉圖源於網絡)

技術分享圖片
愛莫通過計算機仿真和圖像恢復生成不同的人臉3D模型

技術分享圖片
通過恢復的人臉3D模型生產大量幹擾條件下的數據

我們很高興的看到越來越多的公司加入這個陣營,用CG的方式產生數據輔助深度學習算法的訓練,比如無人駕駛3D仿真的Carla,用GAN來讓虛擬樣本更真實的Apple等等。

阿麗塔在成長過程思考自己立身於世的意義,她逐漸認識到自己有能力成為一個改變世界的英雄,整個從純真到成熟的變化也都映射到了眼神變化中。也希望她這雙動人的眼睛,可以為人工智能領域的同行們開辟一片全新天地!

借阿麗塔的慧眼,帶你一起看懂世界