最新人臉檢測 & 識別的趨勢和分析
在今天說最近比較新穎的人臉檢測&識別的時候,為啥會附上上圖和下圖,在江南的同學估計心有體會啊,打過年以來,沒見過陽光,聽說“蕭敬騰”來杭州買了一棟樓,看樣子我們還要難受一個月左右!
但是!!! 聽說上圖是颱風"蝴蝶"即將來襲,是不是會帶走我們進一個月的雨水呢?會不會幫我們拜擺脫陰雨呢?
那我們還是開始正題,今天說到得都是近幾年比較流行的深度學習網路框架,會針對個別幾個框架詳細說說,有興趣的同學,可以回顧我們“ 計算機視覺戰隊 ”公眾號之前推送的一些相關內容!為了方便,我還是附在下面吧!(點選文字有連結)
注:還有很多關於人臉的文章,有興趣的自行去搜索!
:blush:
最新深度網路用語人臉的部分介紹與分析
DeepID網路結構
DeepID 是第一代,其結構與普通的卷積神經網路基本相同,結構圖例如以下:
該結構與普通的卷積神經網路框架的結構很相似。不同點是, 在隱含層,也就是倒數第二層的時候,與Convolutional layer4和Max-pooling layer3相連,鑑於卷積神經網路層數越高感受野越大的特性,這種連線方式能夠既考慮區域性人臉精細特徵,又考慮全域性的整體特徵。
· 實驗結論 ·
-
使用 Multi-scale Patches 的convnet比僅僅使用一個只有整張人臉的patch的效果要好;
-
DeepID 自身的分類錯誤率在40%到60%之間震盪,儘管較高,但 DeepID 是用來學習特徵的,並不需要關注自身分類錯誤率;
-
使用 DeepID 深度學習網路的最後一層softmax層作為特徵表示,效果非常差;
-
隨著 DeepID 的訓練集人數的增長, DeepID 本身的分類正確率和LFW的驗證正確率都在新增。
DeepID2
DeepID2 相對於DeepID有了較大的提高,其主要原因在於在DeepID的基礎上加入了 驗證訊號 。
詳細來說,原本的卷積神經網路最後一層softmax使用的是邏輯迴歸(Logistic Regression)作為最終的目標函式,也就是識別訊號;但在 DeepID2 中,目標函式上加入了驗證訊號,兩個訊號使用加權的方式進行了組合。
· 兩種訊號及訓練過程 ·
識別訊號公式例如以下:
驗證訊號公式例如以下:
因為驗證訊號的計算需要兩個樣本,所以整個卷積神經網路的訓練過程也就發生了改變,之前是將所有資料切分為小的batch來進行訓練,但如今則是每次迭代時隨機抽取兩個樣本,然後進行訓練。
· 實驗結論 ·
對lambda進行調整,也即對識別訊號和驗證訊號進行平衡,發現lambda在0.05的時候最好。使用LDA中計算類間方差和類內方差的方法進行計算。 得到的結果例如以下:
能夠發現,在lambda=0.05的時候,類間方差幾乎不變,類內方差下降了非常多,這樣就保證了類間區分性,而降低了類內區分性。
DeepID2+
DeepID2+ 有例如以下貢獻,①繼續更改了網路結構;②對卷積神經網路進行了大量的分析,發現了幾大特徵。包含:
-
神經單元的適度稀疏性,該性質甚至能夠保證即便經過二值化後,仍然能夠達到較好的識別效果;
-
高層的神經單元對人比較敏感,即對同一個人的頭像來說,總有一些單元處於一直啟用或者一直抑制的狀態;
-
DeepID2+ 的輸出對遮擋很魯棒。
· 網路結構變化 ·
相比於DeepID2, DeepID2+ 做了例如以下三點改動:
-
DeepID層從160維提高到512維;
-
訓練集將CelebFaces+和WDRef資料集進行了融合,共有12000人,290000張圖片;
-
將DeepID層不僅和第四層和第三層的max-pooling層連線,還連線了第一層和第二層的max-pooling層。
DeepID3
DeepID3 有兩種不同的結構,分別為 DeepID3 net1 , DeepID3 net2 (如上圖)。相對DeepID2+,它的層數更多,網路更深,同時還借鑑了 VGG 和 GoogLeNet ,引入了 inception layer ,這個主要是用在了 DeepID3 net2 裡面。網路中還出現了連續兩個conv layer直接相連的情況,這樣使得網路具有更大的receptive fields和更復雜的nonlinearity,同時還能限制引數的數量。
下面稍微帶著說一下 inception layer :
· Inception Layer ·
傳統的ConvNet是將Convulution layer stack在一起,而 Inception 最大的改變就是時 Inception 模組疊加的形式構造網路。按論文裡面說就是,用 Inception (稠密的可利用的元件)近似一個稀疏結構。
將1x1,3x3,5x5的conv和3x3的pooling,stack在一起,一方面增加了網路的width,另一方面增加了網路對尺度的適應性. 主要特點是提高了網路內部計算資源的利用率。
· 效能比較 ·
在訓練樣本上, DeepID3 仍採用原來DeepID2+中使用的樣本,在25個image patches產生的網路上作對比時, DeepID3 net1 優勢最為明顯,而 DeepID3 net2 提升不大顯著。
今天就先講這些吧,下次我們繼續說更近的人臉檢測&識別框架。有興趣的同學請時刻關注我們。
如果您看到這句話,請幫我們點選下" 好看 ",以表對我們的支援,謝謝!

文 末 福 利
人臉資料集,有興趣可以下載,慢慢去實踐,挺好玩的!
■Annotated Database (Hand, Meat, LV Cardiac, IMM face) (Active Appearance Models)
■AR Face (http://cobweb.ecn.purdue.edu/~aleix/aleix_face_DB.html)
■BioID Face Database (BioID Face Database | facedb | BioID)
■Caltech Computational Vision Group Archive (Cars, Motorcycles, Airplanes, Faces, Leaves, Background) (Computational Vision: Archive)
■Carnegie Mellon Image Database (motion, stereo, face, car, ...) (CMU VASC Image Database)
■CAS-PEAL Face Database (The PEAL Face Database)
■CMU Cohn-Kanade AU-Coded Facial Expression Database (http://www.ri.cmu.edu/projects/project_421.html
■CMU Face Detection Databases (http://www.ri.cmu.edu/projects/project_419.html)
■CMU Face Expression Database (http://amp.ece.cmu.edu/projects/FaceAuthentication/download.htm)
■CMU Face Pose, Illumination, and Expression (PIE) Database (http://www.ri.cmu.edu/projects/project_418.html)
■CMU VASC Image Database (motion, road sequences, stereo, CIL’s stereo data with ground truth, JISCT, face, face expressions, car) (CMU VASC Image Database)
■Content-based Image Retrieval Database (Index of /groundtruth)
■Face Video Database of the Max Planck Institute for Biological Cybernetics (Welcome)
■FERET Database (frvt.org)
■Georgia Tech Face Database (http://www.anefian.com/face_reco.htm)
■German Fingerspelling Database (http://www.anefian.com/face_reco.htm)
■Indian Face (http://http://www.cs.umass.edu/~vidit/IndianFaceDatabase)
■MIT-CBCL Car Database (Pedestrian Data)
■MIT-CBCL Face Recognition Database (CBCL FACE RECOGNITION DATABASE)
■MIT-CBCL Face Databases (CBCL SOFTWARE)
■MIT-CBCL Pedestrian Database (New Page 1)
■MIT-CBCL Street Scenes Database (CBCL StreetScenes Database Download Page:)
■NIST/Equinox Visible and Infrared Face Image Database (http://www.equinoxsensors.com/products/HID.html)
■NIST Fingerprint Data at Columbia (Link)
■ORL Database of Faces (The Database of Faces)
■Rutgers Skin Texture (http://www.caip.rutgers.edu/rutgers_texture/)
■The Japanese Female Facial Expression (JAFFE) Database (Japanese Female Facial Expression (JAFFE) Database
■The Ohio State University SAMPL Image Database (3D, still, motion) (http://sampl.ece.ohio-state.edu/database.htm)
■The University of Oulu Physics-Based Face Database (Center for Machine Vision and Signal Analysis)
■UMIST Face Database (http://images.ee.umist.ac.uk/danny/database.html)
■USF Range Image Data (with ground truth) (USF Range Image Database)
■Usenix Face Database (hundreds of images, several formats) (Link)
■USC-SIPI Image Database (collection of digitized images) (SIPI Image Database)
■UCD VALID Database (multimodal for still face, audio, and video) (VALID Database)
■UCD Color Face Image (UCFI) Database for Face Detection (http://ee.ucd.ie/~prag/)
■UCL M2VTS Multimodal Face Database (http://www.tele.ucl.ac.be/PROJECTS/M2VTS/m2fdb.html)
■Vision Image Archive at UMass (sequences, stereo, medical, indoor, outlook, road, underwater, aerial, satellite, space and more) (SIPI Image Database)
■Where can I find Lenna and other images? (comp.compression Frequently Asked Questions (part 1/3)Section - [55] Where can I find Lenna and other images?)
■Yale Face Database (http://cvc.yale.edu/projects/yalefaces/yalefaces.html)
■Yale Face Database B (http://cvc.yale.edu/projects/yalefaces/yalefaces.html)
如果想加入我們“ 計算機視覺戰隊 ”,請掃二維碼加入學習群,我們一起學習進步,探索領域中更深奧更有趣的知識!