COCO loss （人臉識別損失函式）

阿新 • • 發佈：2018-12-30

2017年nips的一篇做分類和識別的工作，其中在人臉識別任務上也做了實驗，Rethinking Feature Discrimination and Polymerization for Large-scale Recognition.Yu Liu, Hongyang Li, XiaogangWang。提出了一個新的損失函式：congenerous cosine，本質上就是一個cosine距離版本的triplet center loss。

motivation：

在做分類、識別任務的時候常見的loss就是softmax，pairwise，triplet以及最近新提出的center loss，基本的共識是既學習類內的資訊又學習類間的資訊是對識別效果最好的監督方式，所以softmax只有類間的監督是比較挫的一種loss，pairwise、triplet都是同時學習類內和類間資訊的，但是都受到取樣的問題導致訓練容易不穩定。center loss作者認為其問題在於他的center是個統計意義值，不是每次迭代update的（這個地方有問題，center loss也是每個iteration在mini-batch裡面更新的）。所以作者提出了一個coco loss，其實主要的特性在於：一是使用了cosine距離；二是用了center；三是把distance本身作為輸入構建softmax loss，使得distance具有softmax特性。具體的loss對比如下圖

基本原理：

因為主要是loss的定義，推演的過程圍繞上面的三個方面講，一是使用cosine距離的loss如下：

這個loss就是要讓同類的cosine距離相比於不同類的更大，但是這個計算複雜度太高所以把和每個樣本的計算改成和中心的計算並且寫成softmax的形式，並做feature歸一化：

最終加上交叉熵：

這裡面需要注意的是有個scale的引數alpha，之前在focal loss裡提到過對於softmax來說，如果feature歸一化，類別數固定的情況下其loss是有個上下限的，這裡面的alpha的作用也是為了對不同的任務調整loss的範圍使得能夠得到更好的效果，對於alpha作者還推導了一下算了個公式：

實驗結果

在人臉人體上都做了實驗，這裡就只列一下人臉的結果，使用了inception-resnet模型，用了ms1M的80k ID\3M人臉圖片就把lfw搞到了99.86%應該是目前最好的結果了，不過資料上應該會有重複的可能而且官網上還沒更新不知道是為啥，會不會也overfit了錯誤lable的樣本？

megaface上的結果：

總結

是個很好的工作，結果也不錯。用歸一化的特徵把cosine距離和center loss結合起來，除了只用中心點這個資訊不夠理想之外其他的都還好，應該跟triplet做些結合或者把中心點變成多個小的中心可能會更好，從資訊的層面上還是丟掉了類之間的輪廓資訊，也就是制衡量樣本到類中心的距離沒辦法很好的表示這個類的樣本空間分佈。

COCO loss （人臉識別損失函式）

COCO loss （人臉識別損失函式）

人臉識別損失函式疏理與分析

用基於center loss的人臉識別模型對LFW人臉資料集進行評測（c++）

CS231n——機器學習演算法——線性分類（下：Softmax及其損失函式）

CS231n——機器學習演算法——線性分類（中：SVM及其損失函式）

TensorFlow北大公開課學習筆記4.4-神經網路優化----正則化（正則化損失函式）

pytorch相關知識（BN、dropoutput+模型載入+損失函式）

Haar分類器（人臉識別、人眼識別）

微信小程式--刷臉認證（人臉識別，上拉載入，下拉重新整理）

深度學習——Face Verificaton（人臉驗證）與Face Recognition（人臉識別）在FaceNet的應用案例

java優先佇列的使用（包括重寫比較函式）

strlen/strcpy的實現（不使用庫函式）

Shell教程（流控制、函式）（第三天）

有n個整數，指定位置m處插入g個值（用指標和函式）

資料庫回顧（DCL DQL聚合函式）

python中的關鍵字---4（匿名/遞迴函式）

d3.js（v5.7）的node與資料匹配（自動匹配擴充套件函式）

《Oracle PL/SQL開發指南》學習筆記31——原始碼除錯——函式和過程（第二部分，函式）

[BZOJ1152][CTSC2006]歌唱王國Singleland（KMP + 概率生成函式）

機器學習資料預處理（sklearn庫系列函式）

COCO loss （人臉識別損失函式）

相關推薦