深度嵌入學習“Sampling Matters in Deep Embedding Learning”

阿新 • • 發佈：2018-12-17

在檢索和驗證任務中，經常使用contrastive 損失或 triplet損失作為損失函式，大多數論文也主要關注如何選取損失函式，這篇論文認為訓練樣本的選取也很重要。提出了distance weighed sampling,選取資訊量更大更穩定的訓練樣本。此外，提出了margin based loss，效果更好。

深度嵌入學習的一般流程：

先驗知識回顧

contastive損失：

三元損失：

對於contrastive損失，困難負樣本挖掘可以幫助更快收斂。但對於三元損失來說，困難負樣本易導致collapse。FaceNet提出了挖掘半困難負樣本的方法：給定anchor-positive對，在batch中，通過如下關係選擇負樣本：

Distance Weighted Margin-Based Loss

1.隨機挑選樣本的問題

在高維空間中，pairwise距離分佈趨向於正態分佈，這意味著如果均勻的選擇負樣本，容易獲得1.414以外的樣本，對於距離小的樣本就很少獲得。

2.只挖掘太困難負樣本的問題

Hard negative樣本通常離anchor的距離較小，這時如果有噪聲，那麼這種取樣方式就很容易受到噪聲的影響，從而造成訓練時的模型坍塌，困難負樣本的梯度方差較大，具有較小的信噪比。

3.distance weighted sampling

根據距離均勻的篩選樣本，及帶權值的篩選，為避免選擇到噪聲樣本，再對篩選進行裁剪。最終，給定anchor樣本，距離加權的取樣通過下式取樣負樣本：

下圖顯示了不同方法取樣負樣本，距離的方差，可以看到提出的距離加權的取樣提供了較大距離範圍的樣本：

三元損失比對比損失好的原因：第一點，三元損失不需要預選的閾值去分割相同、不同的影象，它更能適應outliers；第二點，三元損失僅需要正樣本距離比負樣本距離近，對比損失需要將正樣本聚合的越來越近。

對於三元損失來說，困難負樣本的梯度趨於0，梯度主要來自困難正樣本對，很少來自困難負樣本對，對於網路訓練是沒有幫助的。使用真實距離值代替平方距離值將好點，這在上一篇博文中提到的論文也有提到，即：

論文提出的基於對比損失的改進損失為，$\beta$定義了正例對距離與負例對距離之間的界限，如果正例對距離Dij大於$\beta$，則損失加大；或者負例對距離Dij小於$\beta$，損失加大：

這裡$\beta$是正負樣本的決策邊界，$\alpha$控制分割的邊距。下圖顯示了四種損失與距離的關係：

為了同時使用三元損失的靈活效能，這裡使用較為靈活的決策邊界$\beta$，beta(class)稱為樣本偏置， beta(img)稱為類別偏置，第一個beta(0)是人工定義的初始值，利用梯度下降，不斷調整beta(class)和beta(img)的值（就如同調整神經網路的引數）以在訓練集上達到最優，這時能夠得到最優的beta(class)和beta(img)（每個類一個beta(class)，每個樣本一個beta(img)）:

為了正則化$\beta$，引入超引數v，這裡類似於v-SVM中的技巧

實驗結果

不同樣本取樣方式的對比，在semi-hard取樣方法中，constrastive loss和triplet loss的效能類似，而如果使用隨機取樣，constrastive loss的效能要差很多（triplet loss不能隨機取樣），這其實反證了一個結論：triplet loss的效能不僅僅來自於其自身的函式結構，也與取樣方式有很大的關係。

與其他人臉識別方法的對比：

深度嵌入學習“Sampling Matters in Deep Embedding Learning”

在檢索和驗證任務中，經常使用contrastive 損失或 triplet損失作為損失函式，大多數論文也主要關注如何選取損失函式，這篇論文認為訓練樣本的選取也很重要。提出了distance weighed sampling,選取資訊量更大更穩定的訓練樣本。此外，提出了ma

Sampling Matters in Deep Embdding Learning論文研究

宣告： Sampling Matters in Deep Embdding Learning 這是基於one-shot learning中的metric learning範疇做的研究。metric learning通過將樣本對對映到嵌入空間，在嵌入空間中比

漫談深度強化學習之手寫Deep Q-Network解決迷宮問題

1. Q-Learning回顧上一期我們講了Q-Learning以及Sarsa的演算法流程，同時我們還手寫了基於Q-Learning以及Sarsa來解決OpenAI gym中的FrozenLake問題。今天，我們將藉助神經網路來重新解決這個問題。（FrozenLake問題簡單來

[譯]深度神經網絡的多任務學習概覽(An Overview of Multi-task Learning in Deep Neural Networks)

noi 使用方式 stats 基於共享 process machines 嬰兒 sdro 譯自：http://sebastianruder.com/multi-task/ 1. 前言在機器學習中，我們通常關心優化某一特定指標，不管這個指標是一個標準值，還是企業KPI。為

【李宏毅深度學習合輯】Advanced Topics in Deep Learning - Imitation Learning

advance HA common exp img 技術分享 treat get som You have to force experts to treat some uncommon and extreme situations.

論文閱讀之獻給新手的深度學習綜述——Recent Advances in Deep Learning: An Overview

這篇綜述論文列舉出了近年來深度學習的重要研究成果，從方法、架構，以及正則化、優化技術方面進行概述。本人認為，這篇綜述對於剛入門的深度學習新手是一份不錯的參考資料，在形成基本學術界圖景、指導文獻查詢等方面都能提供幫助。論文地址：https://arxiv.org/pdf/1807.08169v1

深度神經網路的多工學習概覽(An Overview of Multi-task Learning in Deep Neural Networks)

譯自：http://sebastianruder.com/multi-task/ 1. 前言在機器學習中，我們通常關心優化某一特定指標，不管這個指標是一個標準值，還是企業KPI。為了達到這個目標，我們訓練單一模型或多個模型集合來完成指定得任務。然後，我們通過精細調參，來改進模型直至效能不再

深度學習中的池化詳解 | Pooling in Deep learning

本文由多篇部落格總結整理而成，參考部落格見文末，侵刪。目錄最大池化：平均池化重疊池化參考文獻參考部落格首先，什麼是CNN ------------------------------------

深度學習論文翻譯解析（九）：Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

論文標題：Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition　　　　　　標題翻譯：用於視覺識別的深度卷積神經網路中的空間金字塔池論文作者：Kaiming He, Xiangyu Zhang, Shao

Coursera 深度學習吳恩達 deep learning.ai 筆記整理（3-2）——機器學習策略

新的 bsp 誤差 spa 歸納空間 font 處理整理一、誤差分析定義：有時我們希望算法能夠勝任人類能做的任務，但是當算法還沒達到人類所預期的性能時，人工檢查算法錯誤會讓你知道接下來做什麽，這也就是誤差分析檢查，發現會把夠狗當恒，是否需要做一個項目專門處理狗

CS294-112 深度強化學習秋季學期（伯克利）NO.19 Guest lecture: Igor Mordatch (Optimization and Reinforcement Learning in Multi-Agent Settings)

nbsp setting TP for agent image learn ctu Go

深度強化學習（一）： Deep Q Network(DQN)

原文：https://blog.csdn.net/LagrangeSK/article/details/80321265 一、背景 DeepMind2013年的論文《Playing Atari with Deep Reinforcement Learning》指

深度學習方法（五）：卷積神經網路CNN經典模型整理Lenet，Alexnet，Googlenet，VGG，Deep Residual Learning

歡迎轉載，轉載請註明：本文出自Bin的專欄blog.csdn.net/xbinworld。技術交流QQ群：433250724，歡迎對演算法、技術感興趣的同學加入。關於卷積神經網路CNN，網路和文獻中有非常多的資料，我在工作/研究中也用了好一段時間各種常見的model了，就想著

深度強化學習 Deep Reinforcement Learning 學習整理

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

深度學習論文筆記：Deep Residual Networks with Dynamically Weighted Wavelet Coefficients for Fault Diagnosis of Planetary Gearboxes

這篇文章將深度學習演算法應用於機械故障診斷，採用了“小波包分解+深度殘差網路(ResNet)”的思路，將機械振動訊號按照故障型別進行分類。文章的核心創新點：複雜旋轉機械系統的振動訊號包含著很多不同頻率的衝擊和振盪成分，而且不同頻帶內的振動成分在故障診斷中的重要程度經常是不同的，因此可以按照如下步驟設計深度

深度嵌入學習“Sampling Matters in Deep Embedding Learning”

深度嵌入學習“Sampling Matters in Deep Embedding Learning”

Sampling Matters in Deep Embdding Learning論文研究

漫談深度強化學習之手寫Deep Q-Network解決迷宮問題

[譯]深度神經網絡的多任務學習概覽(An Overview of Multi-task Learning in Deep Neural Networks)

【李宏毅深度學習合輯】Advanced Topics in Deep Learning - Imitation Learning

論文閱讀之獻給新手的深度學習綜述——Recent Advances in Deep Learning: An Overview

深度神經網路的多工學習概覽(An Overview of Multi-task Learning in Deep Neural Networks)

深度學習中的池化詳解 | Pooling in Deep learning

深度學習論文翻譯解析（九）：Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

Coursera 深度學習吳恩達 deep learning.ai 筆記整理（3-2）——機器學習策略

CS294-112 深度強化學習秋季學期（伯克利）NO.19 Guest lecture: Igor Mordatch (Optimization and Reinforcement Learning in Multi-Agent Settings)

深度強化學習（一）： Deep Q Network(DQN)

深度學習方法（五）：卷積神經網路CNN經典模型整理Lenet，Alexnet，Googlenet，VGG，Deep Residual Learning

深度強化學習 Deep Reinforcement Learning 學習整理

深度學習論文筆記：Deep Residual Networks with Dynamically Weighted Wavelet Coefficients for Fault Diagnosis of Planetary Gearboxes

深度學習：乳腺論文Deep Multi-instance Networks with Sparse Label Assignment for Whole Mammogram

基於深度學習模型Wide&Deep的推薦

深度強化學習cs294 Lecture8: Deep RL with Q-Function

機器學習與深度學習系列連載：第二部分深度學習（七）深度學習技巧4（Deep learning tips- Dropout）

[Keras深度學習淺嘗]實戰四· Embedding實現 IMDB資料集影評文字分類

深度嵌入學習“Sampling Matters in Deep Embedding Learning”

相關推薦