1. 程式人生 > >人臉識別:coco loss-Rethinking Feature Discrimination and Polymerization for Large-scale Recognition

人臉識別:coco loss-Rethinking Feature Discrimination and Polymerization for Large-scale Recognition

       nips的一篇做分類和識別的工作,其中在人臉識別任務上也做了實驗,Rethinking Feature Discrimination and Polymerization for Large-scale Recognition.Yu Liu, Hongyang Li, XiaogangWang。提出了一個新的損失函式:congenerous cosine,本質上就是一個cosine距離版本的triplet center loss。

       motivation:

       在做分類、識別任務的時候常見的loss就是softmax,pairwise,triplet以及最近新提出的center loss,基本的共識是既學習類內的資訊又學習類間的資訊是對識別效果最好的監督方式,所以softmax只有類間的監督是比較挫的一種loss,pairwise、triplet都是同時學習類內和類間資訊的,但是都受到取樣的問題導致訓練容易不穩定。center loss作者認為其問題在於他的center是個統計意義值,不是每次迭代update的(這個地方有問題,center loss也是每個iteration在mini-batch裡面更新的)。所以作者提出了一個coco loss,其實主要的特性在於:一是使用了cosine距離;二是用了center;三是把distance本身作為輸入構建softmax loss,使得distance具有softmax特性。具體的loss對比如下圖

       

       基本原理:

       因為主要是loss的定義,推演的過程圍繞上面的三個方面講,一是使用cosine距離的loss如下:

       

        這個loss就是要讓同類的cosine距離相比於不同類的更大,但是這個計算複雜度太高所以把和每個樣本的計算改成和中心的計算並且寫成softmax的形式,並做feature歸一化:

         

         最終加上交叉熵:

         

         這裡面需要注意的是有個scale的引數alpha,之前在focal loss裡提到過對於softmax來說,如果feature歸一化,類別數固定的情況下其loss是有個上下限的,這裡面的alpha的作用也是為了對不同的任務調整loss的範圍使得能夠得到更好的效果,對於alpha作者還推導了一下算了個公式:

          

實驗結果

        在人臉人體上都做了 實驗,這裡就只列一下人臉的結果,使用了inception-resnet模型,用了ms1M的80k ID\3M人臉圖片就把lfw搞到了99.86%應該是目前最好的結果了,不過資料上應該會有重複的可能而且官網上還沒更新不知道是為啥,會不會也overfit了錯誤lable的樣本?

         

          megaface上的結果:

          

總結

       是個很好的工作,結果也不錯。用歸一化的特徵把cosine距離和center loss結合起來,除了只用中心點這個資訊不夠理想之外其他的都還好,應該跟triplet做些結合或者把中心點變成多個小的中心可能會更好,從資訊的層面上還是丟掉了類之間的輪廓資訊,也就是制衡量樣本到類中心的距離沒辦法很好的表示這個類的樣本空間分佈。

相關推薦

人臉識別coco loss-Rethinking Feature Discrimination and Polymerization for Large-scale Recognition

       nips的一篇做分類和識別的工作,其中在人臉識別任務上也做了實驗,Rethinking Feature Discrimination and Polymerization for Large-scale Recognition.Yu Liu, Hongyang

人臉識別Contrastive loss和梯度推到

Contrastive loss 最初源於 Yann LeCun “Dimensionality Reduction by Learning an Invariant Mapping” CVPR 2016。  該損失函式主要是用於降維中,即本來相似的樣本,在經過降維(特徵提

人臉識別損失函式之softmax loss和cross entropy Loss

轉載blog:http://blog.csdn.net/u014380165/article/details/77284921 我們知道卷積神經網路(CNN)在影象領域的應用已經非常廣泛了,一般一個CNN網路主要包含卷積層,池化層(pooling),全連線層,損失層等。

人臉識別Loss函式總結

基於深度學習的人臉識別發展,從deepid開始,到今年(或者說去年),已經基本趨於成熟。凡是基於識別的,總是離不開三個東西:資料,網路,以及loss。資料方面,目前的公開資料集中有主打類別數的MS_celeb_1M,有主打各種姿態角與年齡的VggFace2;也有一些主打高質量

人臉識別ArcFace/Insight Face(轉)

mark一下,感謝作者分享 https://blog.csdn.net/fire_light_/article/details/79602705 作者開原始碼:https://github.com/deepinsight/insightface 這篇論文原名是ArcFace,但是由於

人臉識別掃臉

import java.io.ByteArrayOutputStream; import java.io.DataOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.IOException

[Xcode10 實際操作]九、實用進階-(18)影象人臉識別對圖片中的人像進行面部檢測

本文將演示對圖片中的人像,進行面部檢測。 在專案導航區,開啟檢視控制器的程式碼檔案【ViewController.swift】 1 import UIKit 2 //匯入要使用的CoreImage框架 3 //該框架提供了強大和高效的圖片處理功能。 4 //用來對基於畫素的影象進行分析

人臉識別NormFace

提出問題 之前的人臉識別工作,在特徵比較階段,通常使用的都是特徵的餘弦距離 而餘弦距離等價於L2歸一化後的內積,也等價L2歸一化後的歐式距離(歐式距離表示超球面上的弦長,兩個向量之間的夾角越大,弦長也越大) 然而,在實際上訓練的時候用的都是沒有L2歸一化的內積

人臉識別《Arcface》論文詳解,對損失層的改進有較為詳細的講解 人臉識別《Arcface》論文詳解

轉 人臉識別:《Arcface》論文詳解 2018年08月27日 11:18:20 shentanyue 閱讀數:670

開源 | 基於Python的人臉識別識別準確率高達99.38%!

該庫使用 dlib 頂尖的深度學習人臉識別技術構建,在戶外臉部檢測資料庫基準(Labeled Faces in the Wild benchmark)上的準確率高達 99.38%。這也提供了一個簡單的 face_recognition 命令列工具,你可以開啟命令列中任意影象資料夾,進行人臉識別! 特徵:找

人臉識別NormFace中疑問和總結

今天介紹一下NormFace: L2 Hypersphere Embedding for Face Verification Motivation 希望利用正則化解決兩個問題:1. 人臉識別任務裡面的loss有softmax、contrastive、triplet、pai

人臉識別即使不上傳任何照片依然能跟蹤你的個人資訊

本文為數盟原創譯文 請註明出處為數盟社群 除非你是來自俄羅斯,否則你可能從來沒有聽說過這種服務,即通過分析一個人的照片就能找到他在VK.com社交網路中的帳戶。這就是所謂的FindFace。它在2016年2月上線,最近已經頗為流行;這歸功於由聖彼得堡攝影師葉Egor

人臉識別Sphere face論文理解2017

2017的一篇cvpr,SphereFace: Deep Hypersphere Embedding for Face Recognition,繼centerloss之後又一大作。文章主要提出了歸一化權值(normalize weights and zero biases)和

走近人臉識別時代趨勢下的弄潮兒

得益於移動裝置的普及和攝像技術的發展,人臉識別技術突飛猛進,現已廣泛運用於各個行業,如:商鋪客流統計、道路安防監控、公司人臉考勤等

3D人臉重建《Joint 3D Face Reconstruction and Dense Alignment with Position Map Regression Network》

《Joint 3D Face Reconstruction and Dense Alignment with Position Map Regression Network》 目錄 0 前言 1 概述 2 相關工作

視訊行為識別閱讀[2]Temporal Segment Networks: Towards Good Practices for Deep Action Recognition[2016]

[2]Temporal Segment Networks: Towards Good Practices for Deep Action Recognition[2016](TSN網路) 概括: 為了解決長序列的視訊行為識別問題,將長序列切分成短序列並從中隨機選擇部分,作為雙流網路的

論文閱讀筆記四十一Very Deep Convolutional Networks For Large-Scale Image Recongnition(VGG ICLR2015)

結合 等價 選擇 mac 不同的 works info 內存 enc 論文原址:https://arxiv.org/abs/1409.1556 代碼原址:https://github.com/machrisaa/tensorflow-vgg 摘要 本

深度學習研究理解10Very Deep Convolutional Networks for Large-Scale Image Recognition

本文是牛津大學 visual geometry group(VGG)Karen Simonyan 和Andrew Zisserman 於14年撰寫的論文,主要探討了深度對於網路的重要性;並建立了一個19層的深度網路獲得了很好的結果;在ILSVRC上定位第一,分類第二。 一:

COCO loss人臉識別損失函式)

 2017年nips的一篇做分類和識別的工作,其中在人臉識別任務上也做了實驗,Rethinking Feature Discrimination and Polymerization for Large-scale Recognition.Yu Liu, Hongyang Li, Xiao