人臉識別系列（十）：Webface系列2

阿新 • • 發佈：2019-02-10

作者 CASIA

概述

為了得到更好的準確度，深度學習的方法都趨向更深的網路和多個模型ensemble，這樣導致模型很大，計算時間長。本文提出一種輕型的CNN，在取得比較好的效果同時，網路結構簡化，時間和空間都得到了優化，可以跑在嵌入式裝置和移動裝置上。

MFM啟用函式

本文使用了一種稱為MFM的啟用函式，這個結構也很簡單。在輸入的卷積層中，選擇兩層，取相同位置較大的值。

這裡寫圖片描述

寫成公式：

這裡寫圖片描述

輸入的卷積層為2n層，取第k層和第k+n層中較大的值作為輸出，MFM輸出就變成了n層。啟用函式的梯度為

這裡寫圖片描述

這樣啟用層有一半的梯度為0，MFM可以得到稀疏的梯度，可以達到根據結果來更新與之相應的權值的效果

。並且MFM啟用函式相比於ReLU函式，ReLU函式得到的特徵是稀疏高維的，MFM可以得到緊實（compact）的特徵，還能實現特徵選擇和降維的效果。

網路結構

網路最後一層是Sofmax層，實現分類的目的，fc1的結果就是人臉的特徵。

為什麼表格中沒有降維？

每個卷積層都有兩個獨立的部分，獨立進行訓練，然後輸入mfm，也就是說conv2_1和conv2_2是並行的。

卷積層的引數量這麼少？

貌似對於一個卷積核，它的各個維度之間同樣權值共享，這與其他的卷積網路都不一樣（不管是VGG、Inception同一個卷積核的各個維度的引數是不一樣的）。因此大幅度減少了引數。

而且最終的結果也不是很差

訓練

在GTX980上訓練了2個星期

訓練集是CASIA-WebFace(10K人，0.5M影象)

結果

這裡寫圖片描述

關於c圖是和relu作比較的，關於這一點博主存在疑問，即CNN在每個卷積層使用的是兩個獨立的部分來做Maxout，對應的relu只有一個獨立的部分的話，結果可能不那麼有意義，因為網路的引數也有所提升了。

這個表格說明網路很輕量：

這裡寫圖片描述

LFW得分

這裡寫圖片描述

人臉識別系列（十）：Webface系列2

概述

MFM啟用函式

網路結構

訓練

結果

人臉識別系列（十）：Webface系列2

人臉識別系列（四）：Webface系列1（CASIA-WebFace）

各種音視訊編解碼學習詳解之編解碼學習筆記（十）：Ogg系列

java基礎鞏固系列（十）：String、StringBuffer、StringBuilder的使用與比較

.Net Core 商城微服務項目系列（十）：使用SkyWalking構建調用鏈監控（2019-02-13 13:25）

C#資料結構與算法系列（十）：逆波蘭計算器——逆波蘭表示式（字尾表示式）

劍指offer系列（47）：求1+2+3+...+n

人臉識別系列（九）：FR+FCN

人臉識別系列（十三）：SphereFace

人臉識別系列（六）：FaceNet

多線程面試題系列（16）：多線程十大經典案例之一雙線程讀寫隊列數據

ZooKeeper系列之（十）：投票選舉（2）

物聯網平臺構架系列（四）：Amazon, Microsoft, IBM IoT 平臺導論之平臺

物聯網平臺構架系列（六）：Amazon, Microsoft, IBM IoT 解決方案導論之結語

WAS集群系列（5）：集群搭建：步驟3：安裝IHS軟件

【開源】OSharp框架學習系列（1）：總體設計及系列導航

搜索引擎ElasticSearch系列（四）： ElasticSearch2.4.4 sql插件安裝

深入理解JavaScript系列（16）：閉包（Closures）

CUDA實例練習（十）：多個cuda流

DOM筆記（十）：JavaScript正則表達式

人臉識別系列（十）：Webface系列2

概述

MFM啟用函式

網路結構

訓練

結果

相關推薦