1. 程式人生 > >人工智慧(7)---一文讀懂人臉識別技術:商業應用、產品落地、核心技術、市場規模

人工智慧(7)---一文讀懂人臉識別技術:商業應用、產品落地、核心技術、市場規模

一文讀懂人臉識別技術:商業應用、產品落地、核心技術、市場規模

導讀:國際權威市場洞察報告Gen Market Insights近日釋出《全球人臉識別裝置市場研究報告》稱,中國2017年人臉識別產值佔全世界29.29%市場份額,2023年將達到44.59%。報告還提到中國人工智慧公司雲從科技在2017年佔有12.88%市場份額(佔世界比例)。

人臉識別是AI技術發展較快、應用較多的一個領域,目前國內人臉識別應用已相當廣泛,並積累了不少實戰經驗。

本文內容涵蓋人臉識別發展歷程、市場研究、核心技術、商業應用以及產業落地、個人看法等乾貨研究。注意,本文乾貨滿滿,約有2萬7千字,強烈建議大家先收藏後學習!

01 發展史

1. 人臉識別的理解

人臉識別(Face Recognition)是一種依據人的面部特徵(如統計或幾何特徵等),自動進行身份識別的一種生物識別技術,又稱為面像識別、人像識別、相貌識別、面孔識別、面部識別等。通常我們所說的人臉識別是基於光學人臉影象的身份識別與驗證的簡稱。

人臉識別利用攝像機或攝像頭採集含有人臉的影象或視訊流,並自動在影象中檢測和跟蹤人臉,進而對檢測到的人臉影象進行一系列的相關應用操作。技術上包括影象採集、特徵定位、身份的確認和查詢等等。簡單來說,就是從照片中提取人臉中的特徵,比如眉毛高度、嘴角等等,再通過特徵的對比輸出結果。

2. 人臉識別的發展簡史

第一階段(1950s—1980s)初級階段

人臉識別被當作一個一般性的模式識別問題,主流技術基於人臉的幾何結構特徵。這集中體現在人們對於剪影(Profile)的研究上,人們對面部剪影曲線的結構特徵提取與分析方面進行了大量研究。人工神經網路也一度曾經被研究人員用於人臉識別問題中。較早從事 AFR 研究的研究人員除了布萊索(Bledsoe)外還有戈登斯泰因(Goldstein)、哈蒙(Harmon)以及金出武雄(Kanade Takeo)等。總體而言,這一階段是人臉識別研究的初級階段,非常重要的成果不是很多,也基本沒有獲得實際應用。

第二階段(1990s)高潮階段

 這一階段儘管時間相對短暫,但人臉識別卻發展迅速,不但出現了很多經典的方法,例如Eigen Face, Fisher Face和彈性圖匹配;並出現了若干商業化運作的人臉識別系統,比如最為著名的 Visionics(現為 Identix)的 FaceIt 系統。 從技術方案上看, 2D人臉影象線性子空間判別分析、統計表觀模型、統計模式識別方法是這一階段內的主流技術。

第三階段(1990s末~現在)

人臉識別的研究不斷深入,研究者開始關注面向真實條件的人臉識別問題,主要包括以下四個方面的研究:1)提出不同的人臉空間模型,包括以線性判別分析為代表的線性建模方法,以Kernel方法為代表的非線性建模方法和基於3D資訊的3D人臉識別方法。2)深入分析和研究影響人臉識別的因素,包括光照不變人臉識別、姿態不變人臉識別和表情不變人臉識別等。3)利用新的特徵表示,包括區域性描述子(Gabor Face, LBP Face等)和深度學習方法。4)利用新的資料來源,例如基於視訊的人臉識別和基於素描、近紅外影象的人臉識別。

02 市場研究

1. 全球人臉識別市場

前瞻根據人臉識別行業發展現狀;到2016年,全球生物識別市場規模在127.13億美元左右,其中人臉識別規模約26.53億美元,佔比在20%左右。預計到2021年,全球人臉識別市場預計將達到63.7億美元,按預計期間的複合增長率達17.83%。

640?wx_fmt=png

2. 中國人臉識別市場

前瞻根據人臉識別行業發展現狀,估算我國人臉識別市場規模約佔全球市場的10%左右。2010-2016年,我國人臉識別市場規模逐年增長,年均複合增長率達27%。2016年,我國人臉識別行業市場規模約為17.25億元,同比增長27.97%,增速較上年上升4.64個百分點。

640?wx_fmt=png

3. 國內主要玩家分佈

3.1 中國部分人臉識別公司(排名不分先後)

640?wx_fmt=png

640?wx_fmt=png

3.2 四大獨角獸介紹及對比細分領域

(1)曠視科技:

2014年,獲阿里巴巴旗下螞蟻金服投資,主攻金融和監控兩大行業,有子公司曠視智安;團隊成員除了幾名來自清華校友外,還有來自美國哥倫比亞大學、英國牛津大學和美國南加州大學的科研及開發人員,截至目前員工僅有100餘人。

在金融、安防、零售領域分別開始了商業化探索成功發育出Face++Financial,Face++Security,Face++BI等垂直人臉驗證解決方案,主要將人臉識別應用在網際網路產品上,自己做研發,在美圖秀秀、淘寶等網際網路領域得到良好的應用,在金融領域的市場一直佔據沙發前排陣營;2016年獲得上億元C輪融資,最後選擇通過計算機視覺技術與NLP技術的結合,製造出能“識別萬物”的智慧機器人,提供硬體模組,裡面內建他們家的演算法。目前正在準備啟動IPO的步伐,VIE架構讓他們得以繞過A股,不用達到連續三年盈利的標準實現快速上市。

(2)商湯科技:

SenseTime(商湯科技),獲IDG資本投資,主攻金融、移動網際網路、安防監控三大行業;由香港中文大學的湯曉歐建立,“商湯”中的湯指的就是湯曉歐本人,湯曉鷗及其研究團隊所開發的DeepID演算法率先將深度學習應用到人臉識別上,在技術指標上實現了新的突破。主要案例是圍繞各個美化軟體與直播平臺製作人臉貼圖,重點強化了人臉識別的關鍵點檢測及跟蹤技術。

團隊有300多號,也從當初toC轉向toB領域;成立於2014年的商湯科技選擇另闢蹊徑,選擇用“四大美女”這個話題讓人們躁動起來,到最後四大美女走了三個;商湯的網路都是自己設計的,這樣對於深度學習網路的掌控力就會更強,提供SaaS服務的同時,可以通過SaaS把背後的資料拿到,再進行更多更細緻的分析再次提升服務質量。

(3)雲從科技:

2015年4月,周曦拿到戰略投資成立雲從科技,同年針對金融和銀行業推出了40多種解決方案,包含從演算法、產品、銷售、售後的全產業鏈打造,針對農行、建行、交行、中行及多地公安提供定製化服務。團隊成員除了來自中科大的校友外,還來自中國科學院各大研究所、UIUC、IBM、NEC、MicroSoft等全球頂尖學府及研究機構。

截止2016年11月,成立一年半,研發團隊擴充套件為200餘名,核心產品是人臉識別系統及IBIS整合生物識別平臺,還具備3D模型、紅外活體、靜默活體等技術,可根據場景需求自由調節。選擇連線硬體、開發與技術,屬於全產業鏈模式,因為人臉識別系統多數情況下需要深度定製,只有這樣,才能在客戶提出需求的情況下迅速反饋,修改,統一使用者體驗。

(4)依圖科技:

2012 年九月,朱瓏與他的好友林晨曦在創立依圖科技,這家從事人工智慧創新性研究的創企從影象識別入手,首先與全國省市級公安系統合作,對車輛品牌、型號等進行精準識別,隨後擴充套件到人像識別,通過靜態人像比對技術和動態人像比對技術,協助公安系統進行人員身份核查、追逃、監控、關係挖掘等。

發展近6年,依圖科技的產品已經應用到全國二十多個省市地區的安防領域,安防領域之外,依圖也進入智慧城市領域和健康醫療領域,它要協助政府構建"城市大腦",也希望將醫療領域的巨大知識鴻溝縮小,改善醫患體驗。

(5)細分領域對比表

640?wx_fmt=png

(6)主要客戶對比

640?wx_fmt=png

4. 商業模式

4.1 人臉識別商業模式設計步驟

640?wx_fmt=png

4.2 人臉識別盈利模式

640?wx_fmt=png

03 人臉識別的流程及主要技術

1. 人臉識別系統組成

640?wx_fmt=png

2. 人臉識別的一般流程

2.1 人臉採集

(1)簡介

不同的人臉影象通過攝像鏡頭採集得到,比如靜態影象、動態影象、不同的位置、不同表情等,當採集物件在裝置的拍攝範圍內時,採集裝置會自動搜尋並拍攝人臉影象。

(2)人臉採集的主要影響因素

  • 影象大小:人臉影象過小會影響識別效果,人臉影象過大會影響識別速度。非專業人臉識別攝像頭常見規定的最小識別人臉畫素為60*60或100*100以上。在規定的影象大小內,演算法更容易提升準確率和召回率。影象大小反映在實際應用場景就是人臉離攝像頭的距離。

  • 影象解析度:越低的影象解析度越難識別。影象大小綜合影象解析度,直接影響攝像頭識別距離。現4K攝像頭看清人臉的最遠距離是10米,7K攝像頭是20米。

  • 光照環境:過曝或過暗的光照環境都會影響人臉識別效果。可以從攝像頭自帶的功能補光或濾光平衡光照影響,也可以利用演算法模型優化影象光線。

  • 模糊程度:實際場景主要著力解決運動模糊,人臉相對於攝像頭的移動經常會產生運動模糊。部分攝像頭有抗模糊的功能,而在成本有限的情況下,考慮通過演算法模型優化此問題。

  • 遮擋程度:五官無遮擋、臉部邊緣清晰的影象為最佳。而在實際場景中,很多人臉都會被帽子、眼鏡、口罩等遮擋物遮擋,這部分資料需要根據演算法要求決定是否留用訓練。

  • 採集角度:人臉相對於攝像頭角度為正臉最佳。但實際場景中往往很難抓拍正臉。因此演算法模型需訓練包含左右側人臉、上下側人臉的資料。工業施工上攝像頭安置的角度,需滿足人臉與攝像頭構成的角度在演算法識別範圍內的要求。

2.2 人臉檢測

(1)簡介

在影象中準確標定出人臉的位置和大小,並把其中有用的資訊挑出來(如直方圖特徵、顏色特徵、模板特徵、結構特徵及Haar特徵等),然後利用資訊來達到人臉檢測的目的。

(2)人臉關鍵點檢測(人臉對齊)

自動估計人臉圖片上臉部特徵點的座標。

(3)主流方法

基於檢測出的特徵採用Adaboost學習演算法(一種用來分類的方法,它把一些比較弱的分類方法合在一起,組合出新的很強的分類方法)挑選出一些最能代表人臉的矩形特徵(弱分類器),按照加權投票的方式將弱分類器構造為一個強分類器,再將訓練得到的若干強分類器串聯組成一個級聯結構的層疊分類器,有效地提高分類器的檢測速度。

最近人臉檢測演算法模型的流派包括三類及其之間的組合:viola-jones框架(效能一般速度尚可,適合移動端、嵌入式上使用),dpm(速度較慢),cnn(效能不錯)。

2.3 人臉影象預處理

(1)簡介

基於人臉檢測結果,對影象進行處理並最終服務於特徵提取的過程。

(2)原因

系統獲取的原始影象由於受到各種條件的限制和隨機干擾,往往不能直接使用,必須在影象處理 的早期階段對它進行灰度矯正、噪聲過濾等影象預處理。

(3)主要預處理過程

人臉對準(得到人臉位置端正的影象),人臉影象的光線補償,灰度變換、直方圖均衡化、歸一 化(取得尺寸一致,灰度取值範圍相同的標準化人臉影象),幾何校正、中值濾波(圖片的平滑操作以消除噪聲)以及銳化等。

2.4 人臉特徵提取

(1)簡介

人臉識別系統可使用的特徵通常分為視覺特徵、畫素統計特徵、人臉影象變換系數特徵、人臉影象代數特徵等。人臉特徵提取就是針對人臉的某些特徵進行的,也稱人臉表徵,它是對人臉進行特徵建模的過程

(2)人臉特徵提取的方法

  1. 基於知識的表徵方法(主要包括基於幾何特徵法和模板匹配法):根據人臉器官的形狀描述以及它們之間的距離特性來獲得有助於人臉分類的特徵資料,其特徵分量通常包括特徵點間的歐氏距離、曲率、和角度等。人臉由眼睛、鼻子、嘴、下巴等區域性構成,對這些區域性和他們之間結構關係的幾何描述,可作為識別人臉的重要特徵,這些特徵被稱為幾何特徵。

  2. 基於代數特徵或統計學習的表徵方法:基於代數特徵方法的基本思想是將人臉在空域內的高維描述轉化為頻域或者其他空間內的低維描述,其表徵方法為線性投影表徵方法和非線性投影表徵方法。基於線性投影的方法主要有主成分分析法或稱K-L變化、獨立成分分析法和Fisher線性判別分析法。非線性特徵提取方法有兩個重要的分支:基於核的特徵提取技術和以流形學習為主導的特徵提取技術。

2.5 匹配與識別

提取的人臉特徵值資料與資料庫中存貯的特徵模板進行搜尋匹配,通過設定一個閾值,將相似度與這一閾值進行比較,來對人臉的身份資訊進行判斷。

3. 人臉識別的主要方法

3.1 Eigen Face(特徵臉)

MIT實驗室的特克(Turk)和潘特(Pentland)提出的“特徵臉”方法無疑是這一時期內最負盛名的 人臉識別方法。其後的很多人臉識別技術都或多或少與特徵臉有關係,現在特徵臉已經與歸一化的協相關 量(Normalized Correlation)方法一道成為人臉識別的效能測試基準演算法。

人臉識別特徵臉演算法文件:

https://blog.csdn.net/zizi7/article/details/52757300

3.2 Fisher Face(漁夫臉)

貝爾胡米爾(Belhumeur)等提出的 Fisherface 人臉識別方法是這一時期的另一重要成果。該方法 首先採用主成分分析(PCA)對影象表觀特徵進行降維。在此基礎上,採用線性判別分析(LDA)的方法 變換降維後的主成分以期獲得“儘量大的類間散度和儘量小的類內散度”。該方法目前仍然是主流的人臉 識別方法之一,產生了很多不同的變種,比如零空間法、子空間判別模型、增強判別模型、直接的LDA 判 別方法以及近期的一些基於核學習的改進策略。

Fisher Face演算法文件:

https://blog.csdn.net/zizi7/article/details/52999432

3.3 EGM(彈性圖匹配)

其基本思想是用一個屬性圖來描述人臉:屬性圖的頂點代表面部關鍵特徵點,其屬性為相應特徵點處 的多解析度、多方向區域性特徵——Gabor變換12特徵,稱為Jet;邊的屬性則為不同特徵點之間的幾何 關係。對任意輸入人臉影象,彈性圖匹配通過一種優化搜尋策略來定位預先定義的若干面部關鍵特徵點, 同時提取它們的Jet特徵,得到輸入影象的屬性圖。最後通過計算其與已知人臉屬性圖的相似度來完成識 別過程。該方法的優點是既保留了面部的全域性結構特徵,也對人臉的關鍵區域性特徵進行了建模。

彈性圖匹配演算法文件:

https://blog.csdn.net/real_myth/article/details/44828219

3.4 基於幾何特徵的方法

幾何特徵可以是眼、鼻、嘴等的形狀和它們之間的幾何關係(如相互之間的距離)。這些演算法識別速 度快,需要的記憶體小,但識別率較低。

3.5 基於神經網路的方法

神經網路的輸入可以是降低解析度的人臉影象、區域性區域的自相關函式、區域性紋理的二階矩等。這類方法同樣需要較多的樣本進行訓練,而在許多應用中,樣本數量是很有限的。

3.6 基於線段Hausdorff 距離(LHD) 的方法

心理學的研究表明,人類在識別輪廓圖(比如漫畫)的速度和準確度上絲毫不比識別灰度圖差。LHD是基於從人臉灰度影象中提取出來的線段圖的,它定義的是兩個線段集之間的距離,與眾不同的是,LHD並不建立不同線段集之間線段的一一對應關係,因此它更能適應線段圖之間的微小變化。實驗結果表明,LHD在不同光照條件下和不同姿態情況下都有非常出色的表現,但是它在大表情的情況下識別效果不好。

3.7 基於支援向量機(SVM) 的方法

近年來,支援向量機是統計模式識別領域的一個新的熱點,它試圖使得學習機在經驗風險和泛化能力上達到一種妥協,從而提高學習機的效能。支援向量機主要解決的是一個2分類問題,它的基本思想是試圖把一個低維的線性不可分的問題轉化成一個高維的線性可分的問題。通常的實驗結果表明SVM有較好的識別率,但是它需要大量的訓練樣本(每類300個),這在實際應用中往往是不現實的。而且支援向量機訓練時間長,方法實現複雜,該函式的取法沒有統一的理論。

4. 技術發展方向

  1. 結合三維資訊:二維和三維資訊融合使特徵更加魯棒

  2. 多特徵融合:單一特徵難以應對複雜的光照和姿態變化

  3. 大規模人臉比對:面向海量資料的人臉比對與搜尋

  4. 深度學習:在大資料條件下充分發揮深度神經網路強大的學習能力

5. 人臉識別資料庫

  1. Yale人臉資料庫

  2. ORL人臉資料庫

  3. CMU PIE人臉資料庫

  4. FERET人臉資料庫

  5. MIT資料庫

  6. BANCA人臉資料庫

  7. CAS-PEAL人臉資料庫

  8. JAFE表情資料庫

  9. Cohn-Kanade表情資料庫

  10. MMI表情資料庫

6. 技術指標

6.1 人臉檢測中的關鍵指標

例子:在攝像頭某張抓拍影象中,一共有100張人臉,演算法檢測出80張人臉,其中75張是真實人臉,5 張是把路標誤識為人臉。

  • 檢測率:識別正確的人臉/圖中所有的人臉。檢測率越高,代表檢測模型效果越好。

  • 誤檢率:識別錯誤的人臉/識別出來的人臉。誤檢率越低,代表檢測模型效果越好。

  • 漏檢率:未識別出來的人臉/圖中所有的人臉。漏檢率越低,代表檢測模型效果越好。

  • 速度:從採集影象完成到人臉檢測完成的時間。時間約短,檢測模型效果越好。

在這個實際案例中:檢測率=75/100 誤檢率=5/80 漏檢率=(100-75)/100

6.2 人臉識別中的關鍵指標

1000張樣本圖片裡,共600張正樣本。相似度為0.9的圖片一共100張,其中正樣本為99張。雖然0.9閾值的正確率很高,為99/100;但是0.9閾值正確輸出的數量確很少,只有99/600。這樣很容易發生漏識的情況。

  • 檢測率:識別正確的人臉/圖中所有的人臉。檢測率越高,代表檢測模型效果越好。

  • 誤檢率:識別錯誤的人臉/識別出來的人臉。誤檢率越低,代表檢測模型效果越好。

  • 漏檢率:未識別出來的人臉/圖中所有的人臉。漏檢率越低,代表檢測模型效果越好。

  • 速度:從採集影象完成到人臉檢測完成的時間。時間約短,檢測模型效果越好。

在這個實際案例中:檢測率=75/100 誤檢率=5/80  漏檢率=(100-75)/100

6.3 人臉識別中的關鍵指標

1000張樣本圖片裡,共600張正樣本。相似度為0.9的圖片一共100張,其中正樣本為99張。雖然0.9閾值的正確率很高,為99/100;但是0.9閾值正確輸出的數量確很少,只有99/600。這樣很容易發生漏識的情況。

  • 精確率(precision):識別為正確的樣本數/識別出來的樣本數=99/100

  • 召回率(recall):識別為正確的樣本數/所有樣本中正確的數=99/600

  • 錯誤接受率/認假率/誤識率(FARFalse Accept Rate)

  1. 定義:指將身份不同的兩張照片,判別為相同身份,越低越好

  2. FAR = NFA / NIRA

  3. 式中 NIRA 代表的是類間測試次數,既不同類別間的測試次數,打比方如果有1000個識別 模型,有1000個人要識別,而且每人只提供一個待識別的素材,那 NIRA=1000*(1000-1) 。NFA是錯誤接受次數。

  4. FAR決定了系統的安全性,FRR決定了系統的易用程度,在實際中,FAR對應的風險遠遠高於FRR,因此,生物識別系統中,會將FAR設定為一個非常低的範圍,如萬分之一甚至百萬分之一,在FAR固定的條件下,FRR低於5%,這樣的系統才有實用價值。

  • 錯誤拒絕率/拒真率/拒識率(FRR False Reject Rate)

  1. 定義:指將身份相同的兩張照片,判別為不同身份,越低越好

  2. FRR = NFR / NGRA

  3. 上式中NFR是類內測試次數,既同類別內的測試次數,打比方如果有1000個識別模型, 有1000個人要識別, 而且每人只提供一個待識別的素 材,那 NIRA=1000,如果每個人提供N張圖片,那麼 NIRA=N*1000 。NFR是錯誤拒絕次數。

04 行業應用

1. 人臉識別(FR)+其他行業

1.1 FR+金融

(1)實名認證

金融機構傳統上使用人工肉眼判斷、簡訊驗證、繫結銀行卡等手段進行實名認證。這些傳統手段存在準確率不高、客戶體驗較差、成本高等問題,對金融企業業務發展造成了巨大的困擾。基於人臉識別的實名認證方式具有準確率高(一億人中才存在兩人長相相同)、客戶體驗好(認證速度快、客戶操作少)、成本低(相較於傳統認證方式)的優點,已被眾多領先金融企業所採用。

(2)人臉識別在銀行遠端開戶上的應用

在遠端開戶時,金融機構可以通過智慧終端在線上進行身份鑑權驗證,使用人臉識別技術開戶可以極大提升業務辦理的安全性、時效性,並節省大量人力。

(3)刷臉取款

在這方面人臉取代了銀行卡,只需要人臉+密碼即可完成取款。在前兩個方面,人臉識別技術已經被國內各大銀行廣泛採用,刷臉取款方面,農行和招行搶先一步在ATM上線了刷臉取款功能。

640?wx_fmt=png

640?wx_fmt=png

1.2 FR+醫療

(1)重點應用

  • 打擊涉醫犯罪,確保就診安全。建立有針對性的涉醫犯罪人員布控庫,與屬地公安部門配合,進行實時布控。

  • 管控職務犯罪,控制不當競爭。對進入醫院診療區域的醫藥代表進行管控,協助解決藥品流通領域經營不規範、競爭失序等問題。

  • 杜絕職業醫鬧,保護人身安全。打擊頻繁出現的職業醫鬧,提高事件的響應速度,從被動響應變為主動預防。

  • 規範就診流程,和諧醫患關係。重點防範黃牛、醫托等干擾正常就診秩序的特殊人群。

  • 加強監管力度,維護醫保基金。實現就診病人與醫保資訊庫中身份證照的比對,杜絕冒用醫保卡的現象。

  • 易肇事肇禍嚴重精神障礙患者管控。結合“雪亮工程”,確保嚴重精神障礙患者流入地、流出地發現管控到位。

(2)人臉識別在醫療行業的應用突破基於三點

  1. 獲取到目標物件的資訊:因為行政體系不同,醫療行業想獲取到目標物件資訊存在較大困難,需相關行政單位進行關鍵的協調工作。目標物件資訊包含但不侷限於:人臉照片、人像照片、人員基本資訊、人員動態等。

  2. 人臉識別的演算法進一步提升:目前的人臉識別演算法的精度已經達到了相當高的水準,誤報、漏報均已控制在可接受範圍;更近一步的演算法,可以從非結構化的視訊/圖片中獲取更多的價值資訊,從更多地維度來實現不同的應用。

  3. 管理者思維和水平的提升:人工智慧、人臉識別是革命性顛覆性的技術,可以給醫療行業帶來巨大的提升。如何將人臉識別真正應用到醫療行業的各方各面需要管理者與技術提供方一起拓展思維、共同努力。

(3)人臉識別在醫療行業的前景

  1. 對接公安視訊監控、醫警聯動平臺:系統滿足公安現有標準要求,後續可與公安機關視訊監控、醫警聯動等平臺進行無縫對接,將報警資訊及關聯的視訊、圖片推送給轄區派出所,實現聯動。

  2. 人臉身份查證:輸入目標人員照片,即可知道此人身份及其是否屬於重點管控人員,是否曾經來過醫院,及其出現時間、頻次。可用於篩查可疑人員,找到其活動規律。人員軌跡回放:輸入目標人員照片,即可查詢此人是否來過醫院,到過哪些地方。此功能可還原特定人員的行動軌跡,用於嫌疑人行為研判和事後取證。

  3. 對接門禁系統:與門禁系統對接,預留刷臉開門、人臉考勤等高階功能,方便辦公區、手術室、藥品庫、住院部等區域的出入管理。

  4. 對接刷卡系統:與二代證、醫保卡等刷卡系統對接,將採集的人臉照片與證件上儲存的照片進行比對,驗證刷卡人的真實身份。

1.3 FR+新零售

(1)應用人臉識別的優勢

  1. 為重點客戶畫像:幫助賣家獲得顧客和潛在顧客更精準的資訊,構建使用者畫像。可以安裝在超市、商場、門店等入口,統計每天進入門店的人數、大致年齡和性別等;另一種可以安裝在貨架上,分析客戶的關注點和消費習慣等。通過大資料分析挖掘回頭客,提升客戶提袋率和VIP轉化率;

  2. 為零售商降本增益:以智慧化系統來代替人工,以人臉識別系統連線支付端來代替收銀員,能跟快實現零售店的導流和商品人流分析等。

  3. 減少突發事件的產生:門店遇到商品失竊的突發事件,通過對所獲資料的分析,也可以將不良客戶拉入“黑名單”或是降低其信用水平。

  4. 完美連線線上線下:識別系統獲得的使用者偏好還能反哺線上,將所得資料通過線上反饋給廠商,助力於廠商更全面地瞭解消費者需求,進而精準地研發產品,設計營銷策略。這些都是完美實現新零售“打通線上線下”內在要求的極佳方式。

(2)人臉識別的安全隱患

  • 人臉特徵容易被複制:眾所周知,破解密碼的最常用手段是複製,通過竊取數字密碼以及套取指紋來解密的案例己經不勝列舉。與記錄在大腦中或其他介質上面的數字密碼相比,暴露在外面的人臉更容易被複制。通過拍照完全可以獲得一個人的臉部特徵並進行復制,利用整容技術或者用照片識別等欺詐的方法可以騙過人臉支付系統。

  • 個人資訊洩露問題:在科技發達的今天,人們似乎很輕易就可以通過無孔不入的渠道查到消費者的各種資訊。而對於刷臉支付來講,像人臉特徵這種人體密碼一旦交給別人保管,個人資訊的安全係數將如何確保?獲取使用者的面部特徵是否會涉及到個人隱私?基於面部掃描系統的支付在普遍應用之後會不會帶來基於位置服務造成的個人行蹤洩露?

1.4 FR+安防

(1)智慧城市的基礎

  • 視訊分析:基於視訊中的人臉照片進行遠距離、快速、無接觸式的重點人員布控預警。讓應用於車站、機場、地鐵等重點場所和大型商場超市等人群密集的公共場所視訊監控系統能夠對視訊影象進行採集、自動分析、抓取人臉實時比對,主動在監控場景中識別重點關注人員,實現重點人員的布控和識別。

  • 重要場所的布控:對機場、車站、港口、地鐵重點場所和大型商超等人群密集公共場所進行布控,以達到對一些重點人員的排查,抓捕逃犯等目的。

  • 靜態庫或身份庫的檢索:對常住人口、暫住人口的人臉圖片進行預先建庫,通過輸入各種渠道採集的人臉圖片,能夠進行比對和按照相似度排序,進而獲悉輸入人員的身份或者其他關聯資訊,此類應用存在兩種擴充套件形式,單一身份庫自動批量比對並發現疑似的一個人員具有兩個或以上身份資訊的靜態庫查重,兩個身份庫之間自動交叉比對發現交集資料的靜態庫碰撞。

  • 動態庫或抓拍庫的檢索:對持續採集的各攝像頭點位的抓拍圖片建庫,通過輸入一張指定人員的人臉圖片,獲得其在指定時間範圍和指定攝像頭點位出現的所有抓拍記錄,方便快速瀏覽,當攝像頭點位關聯GIS系統,則可以進一步的按照時間順序排列檢索得到的抓拍記錄,並繪製到GIS上,得到人員運動的軌跡。 

(2)反恐行動的助力

現在新疆、西藏等城市都將人臉識別作為基礎設施建設領域的投資重點,由於人員複雜、居住人口相對混亂等因素,這些城市成為了恐怖襲擊等違法犯罪行為的高發場所。而人臉識別技術採用人臉檢測演算法、人臉跟蹤演算法、人臉質量評分演算法以及人臉識別演算法。實現城市居住人員人臉的抓拍採集、建模儲存,實時黑名單比對報警和人臉後檢索等功能。能及時在危險發生之前制止。

(3)兒童安全的保鏢

近年來兒童拐賣活動越來越猖獗,為了更好的保護兒童安全,有些幼兒園、小學在門口已經安裝上了面部識別系統。系統採用人臉識別加IC/ID卡(非接觸式智慧卡) 雙重認證:每一位幼兒在入學註冊時進行相關登記:資料、面像、IC/ID卡號、接送者、接送者面像。

每次入園時刷卡進行報道,放學時刷卡並進行接送家長人臉認證,如果認證失敗拍照後即報警通知管理員,如果認證成功即拍照放行。不論識別成功與否,系統都會記錄下被識別者影象。每一次接送都有詳細的時間、接送人員的照片可供查詢。另外系統提供簡訊提示的擴充套件功能,家長可在手機上看到人臉識別認證時所拍的照片,從而監控到接送這個過程,從其中一個重要源頭杜絕了兒童被拐的可能性。

(4)智慧酒店的管理

以前開房登記流程是:接待人員問詢——身份證掃描確認——支付押金——選房層發房卡——列印紙質票據,這些流程非常繁雜,尤其是身份認證耗時最長,若遇到團隊入住情況則更為複雜,身份證識別裝置可能會因高頻使用出現故障,而急於進房間休息的顧客卻只能在前臺等待手續完成,客戶體驗非常糟糕。

人臉識別技術就能很好的解決這一難題,幫助酒店實現系統化業務管理和一站式共享解決方案。智慧酒店的安防系統利用人臉識別技術,當顧客走到前臺時系統已經自動根據顧客被攝像頭捕捉到的影像調取顧客身份核對。整個驗證核對過程簡單、快速且實現了自動化,更大幅降低了人工識別造成的誤差。而且,針對酒店VIP客人,系統可實時對比酒店大堂的攝像頭影像和登記在酒店基礎系統中的VIP面部資料,當VIP客人到達時,酒店可第一時間提供個性化周到服務,提高客戶的滿意度。

1.5 FR+公安

  • 尋人尋親:對老百姓或其他業務部門提供的照片,直接送入系統進行比對、檢索、篩選,最後人工確認。

  • 派出所擋獲違法人員:對派出所擋獲的人員,登記筆錄,對於其中一些少數民族、聾啞人或保持沉默者等無法查證身份的人員,可拍攝照片送入各種照片庫中比對,排查涉及大案要案人員,以免漏網;或查證其前科,累計處理。

  • 查證無名屍源:需要查證無名屍源時,先拍攝正面照片,送入計算機,如果照片閉眼、破損或變形,可用人像合成系統或人工繪製一幅標準照,送入比對系統比對查證。

  • 目擊者描述排查:獲得現場目擊者對嫌疑人的形象描述後,可用人像合成系統進行排查。

  • 視訊監控照片:一般監控系統針對場景,得到的涉案嫌疑人的影象都有模糊、偏轉、逆側光等質量不佳問題,這時需要根據影象用人像合成系統或人工繪製一幅標準照,送入照片比對系統比對查證。

  • 公共場所集會:在政府、球場等公共場所,時常會有人員滋事,此時公安民警不便直接帶人處理,可以採用長焦攝像機拍攝特寫鏡頭,如果效果不夠好可以用人像合成系統修正,送入比對系統比對查證。

  • 一代/二代居民身份證識別:根據犯罪人員的身份證照片資訊,與系統照片庫中的資訊資料進行比對,提取出與證件上照片相似的人員資訊,能充分利用現有的二代身份證照片資源,為公安部門的工作提供高效有利的幫助。

  • 其他應用:常住人口的比對查詢、暫住人口的比對查詢、重點人口的比對查詢、CCIC在逃人員的比對查詢等。

1.6 FR+商業場景

  • 訪客登記:訪客到訪公司,於平板電腦進行訪客資訊登記,由攝像頭自動抓取人臉,通過系統打印出 訪客貼紙;

  • 識別迎賓:公司員工,貴賓進入公司入口,攝像頭能識別到訪人員,實現門禁功能管理;

  • 人臉識別考勤:通過入口處的前臺平板電腦進行人臉識別考勤,也可通過手機端進行人臉識別考;

  • 智慧生活:較多的園區、樓宇需要人臉門禁系統,人員進出快速通行,便於管理住戶、訪客的進出記 錄;

  • 智慧教育:為嚴防替考事件的發生,確保考試安全,人臉識別可加強考試入場環節的考生身份認證, 並有效實現智慧視訊監考、作弊防控等;

  • 智慧商場:利用人臉識別技術追蹤並分析商場內的人流屬性,人群分佈等。

應用模式典型具體應用特點說明應用領域:

640?wx_fmt=png

640?wx_fmt=png

2. FR的部分應用

2.1 人臉檢測跟蹤

(1)應用

商場客流跟蹤分析,地鐵、火車站、會場、機場等場所的可疑人員的跟蹤檢測,體育賽事的現場監控等。

(2)難點

多人臉跟蹤、遠場識別人臉、背景複雜、低質量圖片人臉識別(演算法預處理),還有側臉(3D重建人物全面),遮擋,模糊,表情變化、強弱光(多特徵融合增強抗干擾力)等各種實際環 境。

(3)建議

遠場識別(可依據距離識別)、背景複雜(可虛化無關場景,凸顯主角)。

2.2 人臉關鍵點定位

(1)應用

可用於圖片的合成、動態圖片的分析(直播行業鑑黃、鑑暴),通過關鍵點分析人臉表情情緒。

(2)難點

大角度側臉,表情變化、遮擋、模糊、明暗等,動靜態關鍵點捕捉。

(3)建議

對模糊部位可進行平滑處理,根據眼睛、嘴的特點建立不同的區域塊等。

2.3 人臉身份認證

(1)應用

關鍵性應用(金融身份認證、海關檢查、火車站和機場等進站),非關鍵性應用(智慧小區居民進出、辦公大樓進出、公司單位上班打卡等)

(2)難點

年輕時的證件照和本人識別匹配、戴眼鏡和未戴眼鏡、側臉和正臉、表情、背景干擾、整容後、雙胞胎及長相類似等。

(3)建議

可基於三維人像分析避免認證時的假冒,動作分析等。(曠視的難以區分蠟像、海報和真人)

2.4 人臉屬性(性別、年齡、種族、表情、飾品、鬍鬚、面部動作狀態)

(1)人臉表情識別(Face expression recognition 簡稱FER)

  1. 普遍認為人類主要有六種基本情感:憤怒(anger)、高興(happiness)、悲傷(sadness)、驚訝(surprise)、厭惡(disgust)、恐懼(fear)。而大多數表情識別是基於這六種情感及其拓展情緒實現的

  2. 主要困難點是:

  1. 表情的精細化程度劃分:每種情緒最微弱的表現是否需要被分類。分類的界限需要產品給出評估規則。

  2. 表情類別的多樣化:是否還需要補充其他類別的情緒,六種情緒在一些場景下遠不能變現人類的真實 情緒。因此除了基本表情識別外,還有精細表情識別、混合表情識別、非基本表情識別等細緻領域的研究。

  3. 缺少魯棒性

(2)人臉性別識別

性別分類是一個典型的二類問題,人臉性別分類問題需要解決的兩個關鍵問題是人臉特徵提取和分類器的選擇。人臉性別識別其實僅能識別到人臉外貌更偏向於女性還是男性,很難對女生男相、男生女相進行正確判斷。

(3)人臉年齡識別

  • 難點:單人的不同年齡段識別和多人的不同年齡段識別,人臉年齡識別常和人臉識別進行組合識別,能更正確的判斷在一定年限內“是否是一個人”的問題;除了以上內容,還有是否戴眼鏡、頭髮長度、膚色等。

  • 建議:識別年齡無變化的人臉用分類即可,而對年齡變化的人臉識別方法是通過年齡模擬,將測試影象和查詢庫中的影象變換到某一共同的年年齡,從而去除年齡不同的影響,使識別在年齡相同的人臉影象進行。

(4)人臉屬性的應用

根據物理屬性(性別、年齡、種族、眼鏡顏值等)可用於廣告定向投放、個性化智慧推薦、顧客分析、婚戀交友等;化學屬性(面部動作、情緒等)可用於即時視訊社交、圖片合成、圖片美化等。

(5)識別建議

人臉屬性分析時,可利用K-近鄰演算法匹配雲端庫裡的類似照片後再對相似屬性進行分析。

2.5 人臉聚類

(1)應用:個性化相簿管理、照片分享社交、婚戀交友相似臉型匹配推薦興趣社交等。

(2)難點:角度、光線、髮型、相似臉型等干擾分類。

(3)建議:可基於一張正臉照片,將其他照片進行依次比對分析後再分類等(智慧相簿、婚戀社交)。

2.6 真人檢測

(1)應用:銀行開戶驗證、車站、機場、公司打卡等。

(2)難點:2D和3D的識別檢測、真人與蠟像、矽膠假冒人臉識別、照片和真人識別檢測驗證等。

(3)建議:可基於三維人像分析避免認證時的假冒等,動態識別驗證以區分假象(曠視的難以區分蠟像、海報和真人)。

2.7 人像美顏/美妝

(1)應用:興趣社交、婚戀交友、影象合成、個性化用品推薦和廣告投放等。

(2)難點:美顏與一般濾鏡效果的區別、美顏後的自然效果等。

(3)建議:基於資料集的演算法更新迭代。

2.8 人體關鍵點(CPM、DeeperCut)

(1)應用:關鍵動作抓拍、人體姿態估計、舞蹈難度評定。

(2)難點:多目標關鍵點定位、關鍵點遮擋、光線強弱等。

(3)建議:關鍵點遮擋(分塊處理、三維構建找尋關鍵點)

3. FR的商業化

3.1 從時間上看商業化的不同階段

640?wx_fmt=png

3.2 從業務場景上看

場景關鍵點:

  • 盤子夠大,支撐公司發展

  • 資料迴流,為公司所用

  • 高頻使用,需求佔比高

  • 可在行業中複製

640?wx_fmt=png

3.3 垂直行業人臉解決方案(地產行業為例)

(1)地產行業分佈

  • 商業地產:辦公樓宇+園區廠區+商業零售+酒店

  • 住宅地產:生活小區+公寓

(2)地產行業的市場規模

640?wx_fmt=png

640?wx_fmt=png

(3)演變方向及客戶痛點

  1. 視訊監控:傳統視訊監控廠家正在進行智慧化轉型,從原先的“監控”視訊,到現在的“讀懂”視訊當中的人、 車、物、事;

  2. 門禁控制:傳統門禁控制領域價值鏈低,所有廠家正在尋求新的方式來轉型,絕大部分都在生物識別方式上進行 摸索;人臉識別面板機、閘機及其它通行道閘雨後春筍般出現;

  3. 樓宇對講:普通樓宇對講功能已無法滿足使用要求,結合人臉識別功能的門禁系統需求越來越多;

  4. 防盜告警:通過智慧化手段,達到降本增效目的,已成為防盜告警、巡更檢查等功能的重點迭代方向;

  5. 視覺化系統:降低非專業人士的使用難度,使得多方資料為“我”所用,為多種決策提供依據;資訊孤島問題亟待解決,萬物互聯已是所有廠家達成的共識。

  6. 資訊孤島問題(痛點):

  1. 智慧化系統種類繁多,系統之間無法實現無縫連線,綜合管理難度大,效率低;

  2. 智慧化子系統資料採集離散,標準不一,資料價值大打折扣,無法為管理提供決策依據和幫助;

  3. 各子系統依靠人工管理,人員配備要求高、勞動強度大,人工成本居高不小;

  4. 絕大多數B端客戶不懂具體業務或細節,需要具象化、視覺化系統呈現。

(4)建設步驟及架構

步驟:

第一步:人員通訊管理

  • 基於人員通行管理的平臺系統(功能性產品+後臺系統管理)

  • 員工、VIP、訪客、陌生人、黑名單等人員許可權管理;

第二步:感測網路融合

  • CCTV、車輛等;

  • 基於“人員”、“車”、“監控”的三位一體智慧建築場景應用;

  • 其他子系統模組連結,形成整體感測網路,智慧物聯;

第三步:商業地產+新零售

  • 人員、車輛、CCTV三功能在工作+消費場景融合;

  • 構建以人為核心的商業綜合體運營方案。

整體IoT架構:

640?wx_fmt=png

640?wx_fmt=png

(5)影響因素與優化方案

  • 決定監控系統性能的幾個主要因素:

  1. 模板庫的人數:不宜大,包含關鍵人物即可;

  2. 經過攝像頭的人數:同時出現在攝像頭的人數決定了單位時間裡的比對次數;

  3. 報警反饋時間:實時性越強,對系統性能要求越高;

  4. 攝像頭採集幀數:幀數越高,人員經過攝像頭前採集的次數越多,比對的次數也越多。

  • 實戰中的優化方案:

  1. 使用更先進的高清攝像頭(3-5百萬);

  2. 室內均勻光線,或室外白天,無側光和折射光;

  3. 人群面向同樣的方向,朝向相機的方向運動;

  4. 恰當的監控點,如走廊、巷子或安檢門/閘機口等(不要一群人同時出現);

  5. 相機與人臉的角度小於20度。

3.4 頂尖公司的應用舉例

(1)Google:2011年07月 谷歌收購人臉識別軟體公司PittPatt

(2)Facebook:2012年6月 Facebook收購以色列臉部識別公司Face.com

(3) 微軟:2012年6月 微軟亞洲研究院釋出人臉檢測演算法,面部識別系統

(4)網易:2012年5月,網易人臉識別系統全國公測,用於郵箱登陸

(5)百度:2012年12月 百度推出人臉識別,基於影象的全網人臉搜尋

(6)阿里:2015年11月,在推出支付寶刷臉認證付款

(7)騰訊:2012年下半年,成立優圖專案組

05 人臉識別(FR)的產品落地

1. FR技術產品的優勢

1.1 非接觸

人臉影象的採集不同於指紋、掌紋需要接觸指掌紋專用採集裝置,指掌紋的採集除了對裝置有一定的磨損外,也不衛生,容易引起被採集者的反感,而人臉影象採集的裝置是攝像頭,無須接觸。

1.2 非侵擾

人臉照片的採集可使用攝像頭自動拍照,無須工作人員干預,也無須被採集者配合,只需以正常狀態經過攝像頭前即可。

1.3 友好

人臉是一個人出生之後暴露在外的生物特徵,因此它的隱私性並不像指掌紋、虹膜那樣強,因此人臉的採集並不像指掌紋採集那樣難以讓人接受。

1.4 直觀

我們判斷一個人是誰,通過看這個人的臉就是最直觀的方式,不像指掌紋、虹膜等需要相關領域專家才可以判別。

1.5 快速

從攝像頭監控區域進行人臉的採集是非常快速的,因為它的非干預性和非接觸性,讓人臉採集的時間大大縮短。

1.6 簡便

人臉採集前端裝置——攝像頭隨處可見,它不是專用裝置,因此簡單易操作。

1.7 可擴充套件性好

它的採集端完全可以採用現有視訊監控系統的攝像裝置,後端應用的擴充套件性決定了人臉識別可以應用在出入控制、黑名單監控、人臉照片搜尋等多領域。

2. FR三大識別場景

2.1 人臉確認(1:1)

  1. 簡介:將某人面像與指定人員面像進行一對一的比對,根據其相似程度來判斷二者是否是同一人,相似 程度一般以能否超過某一量化閥值為依據。簡單的說就是A/B兩張照片比對,產生的計算數值是否達到要求。

  2. 產品應用:快速的人臉識別比對,移動支付認證、安全性身份核對、作為身份確認的一種新方式,比如考生身份確認、公司考勤確認、各種證件照和本人確認。

  3. 實際問題:產品在系統設計的邏輯上,需要先考慮調取已儲存物件資訊的先驗條件。通過介面/語音的提示,使得待認證者預先知道自己正處於被核對的過程中,且已預先了解擬核對物件的身份。

  4. 比對來源的三種主要方式:

  1. 使用者自傳照片,比如支付寶的人臉比對,使用者自傳的照片最大的問題是照片質量的合格率太低,拍照的光線、角度等因素會導致採集源的質量下降,不利於後期的大批量人臉特徵碼管理。

  2. 使用身份證讀卡器,讀取身份證上的照片,遺憾的是這張照片2K的大小,不過也是目前用最多的源照片提取方式,比較適合簽到場合。

  3. 使用公安部旗下NCIIC的人臉比對介面(注意,不是網紋照片介面,這個介面已經不對外),使用的是直接的人臉比對介面。

2.2 人臉辨認(1:N)

(1)簡介

將某人面像與資料庫中的多人的人臉進行比對,並根據比對結果來鑑定此人身份,或找到其中最相似的人臉,並按相似程度的大小輸出檢索結果。

(2)產品應用

人臉開門、人臉檢索,排查犯罪嫌疑人、失蹤人口的全庫搜尋、一人多證的重複排查等。

(3)實際問題

  • 走失兒童的專案中去: 這一類系統的部署需要兩個條件:A. BCD基本庫(比如1000萬人) B.強大的演算法硬體

  • 零售店中的刷臉支付長江,需要使用者預先輸入全手機號,確定使用者身份再進行人臉識別,將原本為1:N的問題轉化為了1:1的問題。

(4)產品難點

a. 1:N中的N能夠支援多大

  • 場景多樣化:從一個班級百號人刷臉簽到,到一個公司千號人的刷臉打卡,再到一個學校的幾萬人,一個四線城市幾十 萬人,一個一線城市的幾千萬人,難度是呈指數上升的。

  • 公司實際情況:目前各家公司的成熟人臉識別應用能夠支援幾萬到幾百萬人不等的應用場景,而且還有一個錯誤率的概念。比如,公司宣稱千萬分之一的錯誤率的情況下(1/10000000),人臉通過率其實只有93%,這是因為很難做到一定不發生錯誤,而且每個人都能識別通過。(假如一家公司說自己能做到億分之一的錯誤率,通過率能做到98%以上,多半是虛假宣傳,在實際使用中是很難達到的)

b. 非配合場景

  • 在配合場景下:比如ATM機刷臉取款,使用者會自主配合,將人臉以一個理想的角度通過識別。

  • 而在非配合應用場景下,比如監控視訊下的人臉識別,追蹤違法犯罪分子的身份資訊,情況就要困難得多。這種情況下,使用者臉部會發生角度偏大,遮擋,光線不可控等問題。

c. 跨人種,跨年齡識別問題

  • 研究發現,在一個數據集上訓練好的模型,想到遷移到另外一個人種上,效果會出現較大程度的下降。另 外,人臉隨著年齡的變化帶來的改變也給人臉識別帶來不小的挑戰。

  • 要改善這樣的問題,一個必要條件是需要建立一個足夠完備的跨人種,跨年齡的人臉資料庫;在國內的話,是 以漢族人為主,同時跨年齡的人臉資料庫也比較難收集,需要不短的時間跨度。

d. 產品體驗

  • 近來備受關注的刷臉支付,很多時候都會要求使用者輸入全手機號,或手機號後四位,以縮小使用者搜尋庫大 小,實際上這是比較影響體驗的。

  • 西安一高校晨讀刷臉簽到,由於系統實際響應匹配時間過長,導致學生排百米長隊。

2.3 多人臉檢索(N:N)

(1)簡介

1:N同時作業就是N:N了,同時相應多張照片檢索需求。

(2)實際產品問題中

  • 在視訊級N:N的校驗中,如果要提高通過率,很多時候是採取降低準確率的方式,降低演算法佇列數量;同樣在一些比賽中為了降低誤識率,大大提高了準確率,所以演算法在校驗的過程中必須遵循至少一個固定標準,追求的是速度效率還是最高準確率。

  • 視訊流的幀處理所用,對伺服器的計算環境要求嚴苛,目前的算法系統所支撐的輸出率非常有限。

主要的限制如下:

海量的人臉照片解析需要大量運算(目前很少看到在採集端直接解析的,都是照片剪裁)海量的人臉照片傳輸需要大量的頻寬(常見的720布控攝像頭抓取最小的人臉照片為20K)海量的人臉照片在後臺檢索需要耗費大量的運算(國內主流主機為例,最多到24路攝像頭)。

640?wx_fmt=png

3. 產品實戰中的物理問題

3.1 光照問題

(1)簡介

光照問題是機器視覺重的老問題,在人臉識別中的表現尤為明顯。由於人臉的3D結構,光照投射出的陰影,會加強或減弱原有的人臉特徵。

(2)解決思路

A、對其進行包括光照強度和方向、人臉反射屬性的量化,面部陰影和照度分析等,嘗試建立數學模型,以利用這些光照模型,在人臉影象預處理或者歸一化階段儘可能的補償乃至消除其對識別效能的影響,將固有的人臉屬性(反射率屬性、3D表面形狀屬性)和光源、遮擋及高光等非人臉固有屬性分離開來。

B、基於光照子空間模型的任意光照影象生成演算法,用於生成多個不同光照條件的訓練樣本,然後利用具有良好的學習能力的人臉識別演算法,如子空間法,SVM等方法進行識別。

3.2 人臉姿態問題

(1)簡介

與光照問題類似,姿態問題也是目前人臉識別研究中需要解決的一個技術難點。姿態問題涉及頭部在三維垂直座標系中繞三個軸的旋轉造成的面部變化,其中垂直於影象平面的兩個方向的深度旋轉會造成面部資訊的部分缺失。針對姿態的研究相對比較的少,目前多數的人臉識別演算法主要針列正面、準正而人臉影象,當發生俯仰或者左右側而比較厲害的情況下,人臉識別演算法的識別率也將會急劇下降。面部幅度較大的哭、笑、憤怒等表情變化同樣影像著面部識別的準確率。

(2)解決思路

  • 第一種思路:是學習並記憶多種姿態特徵,這對於多姿態人臉資料可以容易獲取的情況比較實用,其優點是演算法與正面人臉識別統一,不需要額外的技術支援,其缺點是儲存需求大,姿態泛化能力不能確定,不能用於基於單張照片的人臉識別演算法中等。

  • 第二種思路:是基於單張檢視生成多角度檢視,可以在只能獲取使用者單張照片的情況下合成該使用者的多個學習樣本,可以解決訓練樣本較少的情況下的多姿態人臉識別問題,從而改善識別效能。

  • 第三種思路:是基於姿態不變特徵的方法,即尋求那些不隨姿態的變化而變化的特徵。中科院計算所的思路是採用基於統計的視覺模型,將輸入姿態影象校正為正面圖像,從而可以在統一的姿態空間內作特徵的提取和匹配。

3.3 遮擋問題

對於非配合情況下的人臉影象採集,遮擋問題是一個非常嚴重的問題。特別是在監控環境下,往往彼監控物件都會帶著眼鏡,帽子等飾物,使得被採集出來的人臉影象有可能不完整,從而影響了後面的特徵提取與識別,甚至會導致人臉檢測演