ECCV 2018 DSLT:《Deep Regression Tracking with Shrinkage Loss》論文筆記

阿新 • • 發佈：2019-01-16

理解出錯之處望不吝指正。

本文模型叫做DSLT，將跟蹤任務視為迴歸問題去解決。主要貢獻包括：①.提出一種收縮損失函式，降低背景資訊中的那些簡單負樣本對損失函式的貢獻；②.使用殘差連線，融合多個卷積層和特徵圖。具體的網路結構如下圖所示：

在上圖中，紅色虛線左側是特徵提取層，文中採用的是VGG-16。右側是迴歸網路，使用第一幀進行訓練，並逐幀更新。

收縮損失函式

傳統的迴歸跟蹤問題可視為下式所示的優化問題：

$argmin_{W}\left \| W*X-Y \right \|^{2}+\lambda \left \| W \right \|^2$

其中 $*$ 代表卷積操作， $W$ 代表卷積的權重， $Y$ 是使用高斯函式生成的樣本的軟標籤。將其寫成損失函式的形式如下：

$L(W)=\left \| W*X-Y \right \|^{2}+\lambda \left \| W \right \|^2$

$W_{t}=W_{t-1}-\eta \frac{\partial L}{\partial W}$

觀察上圖我們可以看出，對於一個輸入的patch，輸出的響應圖 $P$

和軟標籤 $Y$ 中，其實背景資訊的差別並不大，但是由於這種簡單的背景資訊（負樣本）較多，導致對於整張圖的損失函式來說，簡單負樣本的貢獻較大，這就是文中所說的資料不平衡問題。

我們使用 $P$ 表示每次迭代得到的響應圖， $p$ 代表響應圖中的一個位置的值（區間[0,1]中的一個值）， $y$ 代表該位置的標籤（1或者0），可以定義“不相似度”為 $l=\left | p-y \right |$ ，寫成均方誤差形式，可定義損失函式：

$L_{2}=\left | p-y \right |^{2}=l^2$

最近有一篇文獻中指出，在損失函式中增加一個調節項可以減輕資料不平衡的問題。構造出如下所示的損失函式：

$L_{F}=l^{\gamma }\cdot L_{2}=l^{2+\gamma }$

為啥上式可以減輕資料不平衡問題？說說個人理解，不知道對不對。比如現在有兩個位置， $l_1=0.3$ ， $l_2=0.8$ （我們將 $l<0.5$ 視為簡單樣本， $l>0.5$ 視為困難樣本），使用 $L_2$

損失時，前者的損失是0.09，後者的損失是0.64。若使用 $L_F$ 損失，前者的損失是0.027，後者的損失是0.512。而我們可以算出0.64/0.09大約為7.1，0.512/0.027約為19。這樣，從比例上看，使用 $L_F$ 損失時，簡單負樣本的貢獻程度變得較小。

為了簡便，文中使用 $\gamma =1$ 的情況舉例。作者的意思是，我們使用 $L_F$ 損失，既使簡單樣本的損失變小了，但同時也使困難樣本的損失變小了，這樣不好。於是，作者提出了一個函式來代替 $l^{\gamma }$ ，形如下式：

$f(l)=\frac{1}{1+exp(a\cdot (c-l))}$

式中 $a$ 和 $c$ 分別是超引數，而這個函式繪製出來如下圖所示：

我們可以看出，當 $l>0.5$ 的時候，函式的輸出接近1，而 $l<0.5$ 的時候，函式的輸出小於1。這樣就可以只對簡單樣本新增懲罰，使其損失變小，而對困難樣本不造成影響。於是，損失函式就變成了：

$L_{s}=f(l)\cdot L_2$

使用其重寫損失函式：

$L_{s}(W)=\frac{exp(Y)\cdot \left \| W*X-Y \right \|^{2}}{1+exp(a\cdot (c-(W*X-Y)))}+\lambda\left \| W^2 \right \|$

文中設定 $a=10,c=0.2$ 。

作者說，這個損失函式可以提高跟蹤效果，加速訓練，加快收斂。

殘差連線

文中說，ECO是基於多個卷積層獨立學習了一個CF，CREST是基於一個單獨的卷積層學習一個基礎的殘差連線網路，而本文的模型先使用殘差連線融合多個卷積層，然後再進行迴歸學習。作者說，本文的模型對不同層級的語義資訊進行了充分的利用，而不是像ECO和CREST僅僅用於響應圖的融合。

實驗

OTB

Temple Color 128

VOT2016

不同的損失函式

ECCV 2018 DSLT:《Deep Regression Tracking with Shrinkage Loss》論文筆記

收縮損失函式

殘差連線

實驗

ECCV 2018 DSLT:《Deep Regression Tracking with Shrinkage Loss》論文筆記

ECCV2018 Deep Regression Tracking with Shrinkage Loss 目標跟蹤收縮損失

【小白筆記】目標跟蹤Deep Regression Tracking with Shrinkage Loss

part-aligned系列論文：1707.Deep Representation Learning with Part Loss for Person ReID 論文閱讀筆記

Information Extraction over Structured Data: Question Answering with Freebase【論文筆記】

VITAL: VIsual Tracking via Adversarial Learning論文筆記

《Wide & Deep Learning for Recommender Systems》論文筆記

ECO: Efficient Convolution Operators for Tracking視訊目標跟蹤論文筆記（PPT版）

Joint Deep Learning For Pedestrian Detection（論文筆記-深度學習：行人檢測）

深度學習Tracking（1）——Learning to Track at 100 FPS with Deep Regression Networks（程式碼理解）

基於自適應彈性網路迴歸的目標跟蹤(OBJECT TRACKING WITH ADAPTIVE ELASTIC NET REGRESSION)閱讀筆記

論文翻譯：Deep SORT: Simple Online and Realtime Tracking with a Deep Association Metric

計算機視覺之目標跟蹤——論文Learning to Track at 100 FPS with Deep Regression Networks

Regression Tutorial with the Keras Deep Learning Library in Python

Deep SORT: Simple Online and Realtime Tracking with a Deep Association Metric

Occlusion-free Face Alignment: Deep Regression Networks Coupled with De-corrupt AutoEncoders

GOTURN——Learning to Track at 100 FPS with Deep Regression Networks

ECCV 2018 | 曠視科技提出GridFace：通過學習區域性單應變換實現人臉校正

ECCV 2018 論文閱讀筆記——Acquisition of Localization Confidence for Accurate Object Detection

FlowTrack－End-to-end Flow Correlation Tracking with Spatial-temporal Attention(CVPR2018)

ECCV 2018 DSLT:《Deep Regression Tracking with Shrinkage Loss》論文筆記

收縮損失函式

殘差連線

實驗

相關推薦