商湯開源利用無標註資料大幅提高精度的人臉識別演算法
(歡迎關注“我愛計算機視覺”公眾號,一個有價值有深度的公眾號~)
人臉識別是最近幾年計算機視覺領域取得長足進步的領域,這得益於不斷進步的深度學習強大的模型擬合能力和有標註的大型資料集的建立,已經出現了用於人臉識別的有標註的百萬量級的資料集。
但繼續擴大規模資料集變得越來越困難,即使是人工手工標註,當資料集規模越來越大也不可避免會引入噪聲,如何利用廉價的無標註的人臉影象資料成為一個亟需破解的難題。
來自商湯科技、香港中文大學、南洋理工大學的研究人員日前發表於ECCV2018的論文《Consensus-Driven Propagation in Massive Unlabeled Data for Face Recognition》,展示了一種從未標註人臉影象生成樣本標籤對,並將其用於監督學習模型訓練的方法,提供了一種低成本擴大資料集規模提高人臉識別精度的新思路。
值得一提的是,這篇論文解決的問題與現實中的人臉識別應用場景密切相關,其假設已經有了少量已經標註的資料,而未標註的人臉影象資料是來自於不受控的環境中採集的,且這些人與資料庫中已經有標註的人沒有重疊,希望將這些資料賦予標籤加入到訓練集中。
作者資訊:
演算法思想
演算法的核心動機是從未標註資料中找到那些來自同一個人的偽正樣本人臉影象對,將其加入訓練集,擴大訓練集的規模。
一個很簡單的想法,是提取特徵然後聚類,將聚類後的標籤作為偽樣本標籤,但是普通的聚類難以提供高質量可信賴的標籤,一個直觀的例子,比如不同人側臉的影象相似程度比同一個人正臉和側臉影象相似程度要高。
如何構建可靠的來自同一個人的偽正樣本對呢?請看下圖:
作者發明了一種稱為Consensus-Driven Propagation(共識驅動傳播)的模型,該模型中有三種重要角色:base-model(基模型),committee model(委員模型),mediator model(調解員模型)。
base-model和committee model是從有標註資料中訓練出來的深度學習模型分類器,該文使用不同的網路架構訓練多個模型,使用它們對未標註的人臉影象提取特徵,然後使用這些特徵構建未標註樣本的K-NN圖,這些K-NN圖初步反映了同一個人不同人臉影象之間的檢視關係。
作者嘗試了很多深度模型:
然後使用mediator model根據K-NN圖的連線關係和各種多樣性特徵,分類K-NN圖中具有連線關係的兩個人臉影象樣本是否來自同一個人。文中作者使用了多層感知機(MLP)作為mediator model。
很顯然,mediator model在訓練的時候是在有標註的資料上構建正負樣本對的,這正是Consensus-Driven Propagation(共識驅動傳播)的由來,未標註的人臉影象來自同一個人的多幅影象之間的關係與已標註的同一個人的多幅影象之間的關係是相似的,表現為它們的K-NN圖節點之間的關係相似。
提取出的樣本關係圖:
構造的偽正樣本影象示例:
紅色框代表被mediator model拒絕的異常樣本。
構建完偽標籤,將其加入訓練集,但是訓練的時候其使用不同於有標註資料的Loss,在base-model上重新訓練。
實驗結果
作者在MageFace和IJB-A人臉資料集上做了實驗,將資料集均分成11份,訓練的時候僅使用十一分之一的標註資料,逐步增加未標註資料,比較最終正確率,並與使用了所有標註資料的結果比較。
下圖展示了實驗中使用的模型網路架構和分別在這兩個資料集上取得的精度,還有整合後的精度。
下圖展示了,隨著未標註資料的加入,模型精度不斷提高。
在MageFace資料集上,不使用未標註資料(即僅使用十一分之一的訓練資料)精度為61.78%,使用了10份未標註資料的結果是78.18%,而使用全監督的方法(使用所有真實標註)精度為78.52%,證明所提出的方法生成的偽標籤加入訓練集大大提高了模型準確度(16.4%),取得了與全監督方法相匹敵的效能。
比較有意思的是,使用該文的方法在IJB-A上打敗了全監督的方法(理論上是不應該的),作者解釋這是因為IJB-A資料庫本身引入了較多的標籤噪聲。
總結
這篇文章提出的方法非常有價值,低成本擴大資料規模,其不僅適用於人臉識別,在所有識別的任務中幾乎都可以嘗試,從IJB-A的實驗結果看,其甚至可以成為一種資料清洗的方法。
在周志華老師的《機器學習》西瓜書中,有一章專門講解了半監督學習,在深度學習對標註資料胃口越來越大的時候,與本文類似的半監督相關的方法必將越來越受到學術界的關注。
如果你還沒入手這本書,歡迎點選下面連結購買(^_^)
論文:
https://arxiv.org/abs/1809.01407
程式碼:
https://github.com/XiaohangZhan/cdp/
程式碼、論文下載:
在“我愛計算機視覺”公眾號對話介面回覆“CDP”,即可收到程式碼、論文的百度雲下載地址。
(歡迎關注“我愛計算機視覺”公眾號,一個有價值有深度的公眾號~)
【本文由“我愛計算機視覺”釋出,2018年09月16日】