1. 程式人生 > >ECCV 2018 DSLT:《Deep Regression Tracking with Shrinkage Loss》論文筆記

ECCV 2018 DSLT:《Deep Regression Tracking with Shrinkage Loss》論文筆記

  理解出錯之處望不吝指正。

  本文模型叫做DSLT,將跟蹤任務視為迴歸問題去解決。主要貢獻包括:①.提出一種收縮損失函式,降低背景資訊中的那些簡單負樣本對損失函式的貢獻;②.使用殘差連線,融合多個卷積層和特徵圖。具體的網路結構如下圖所示:

  在上圖中,紅色虛線左側是特徵提取層,文中採用的是VGG-16。右側是迴歸網路,使用第一幀進行訓練,並逐幀更新。

  • 收縮損失函式

  傳統的迴歸跟蹤問題可視為下式所示的優化問題:

    argmin_{W}\left \| W*X-Y \right \|^{2}+\lambda \left \| W \right \|^2

  其中*代表卷積操作,W代表卷積的權重,Y是使用高斯函式生成的樣本的軟標籤。將其寫成損失函式的形式如下:

    L(W)=\left \| W*X-Y \right \|^{2}+\lambda \left \| W \right \|^2

    W_{t}=W_{t-1}-\eta \frac{\partial L}{\partial W}

  觀察上圖我們可以看出,對於一個輸入的patch,輸出的響應圖P

和軟標籤Y中,其實背景資訊的差別並不大,但是由於這種簡單的背景資訊(負樣本)較多,導致對於整張圖的損失函式來說,簡單負樣本的貢獻較大,這就是文中所說的資料不平衡問題。

  我們使用P表示每次迭代得到的響應圖,p代表響應圖中的一個位置的值(區間[0,1]中的一個值),y代表該位置的標籤(1或者0),可以定義“不相似度”為l=\left | p-y \right |,寫成均方誤差形式,可定義損失函式:

    L_{2}=\left | p-y \right |^{2}=l^2

  最近有一篇文獻中指出,在損失函式中增加一個調節項可以減輕資料不平衡的問題。構造出如下所示的損失函式:

    L_{F}=l^{\gamma }\cdot L_{2}=l^{2+\gamma }

  為啥上式可以減輕資料不平衡問題?說說個人理解,不知道對不對。比如現在有兩個位置,l_1=0.3l_2=0.8(我們將l<0.5視為簡單樣本,l>0.5視為困難樣本),使用L_2

損失時,前者的損失是0.09,後者的損失是0.64。若使用L_F損失,前者的損失是0.027,後者的損失是0.512。而我們可以算出0.64/0.09大約為7.1,0.512/0.027約為19。這樣,從比例上看,使用L_F損失時,簡單負樣本的貢獻程度變得較小。

  為了簡便,文中使用\gamma =1的情況舉例。作者的意思是,我們使用L_F損失,既使簡單樣本的損失變小了,但同時也使困難樣本的損失變小了,這樣不好。於是,作者提出了一個函式來代替l^{\gamma },形如下式:

    f(l)=\frac{1}{1+exp(a\cdot (c-l))}

  式中ac分別是超引數,而這個函式繪製出來如下圖所示:

   

  我們可以看出,當l>0.5的時候,函式的輸出接近1,而l<0.5的時候,函式的輸出小於1。這樣就可以只對簡單樣本新增懲罰,使其損失變小,而對困難樣本不造成影響。於是,損失函式就變成了:

    L_{s}=f(l)\cdot L_2

  使用其重寫損失函式:

    L_{s}(W)=\frac{exp(Y)\cdot \left \| W*X-Y \right \|^{2}}{1+exp(a\cdot (c-(W*X-Y)))}+\lambda\left \| W^2 \right \|

  文中設定a=10,c=0.2

  作者說,這個損失函式可以提高跟蹤效果,加速訓練,加快收斂。

  • 殘差連線

  文中說,ECO是基於多個卷積層獨立學習了一個CF,CREST是基於一個單獨的卷積層學習一個基礎的殘差連線網路,而本文的模型先使用殘差連線融合多個卷積層,然後再進行迴歸學習。作者說,本文的模型對不同層級的語義資訊進行了充分的利用,而不是像ECO和CREST僅僅用於響應圖的融合。

  • 實驗

  OTB

  Temple Color 128

  VOT2016

  不同的損失函式

相關推薦

ECCV 2018 DSLT:《Deep Regression Tracking with Shrinkage Loss論文筆記

  理解出錯之處望不吝指正。   本文模型叫做DSLT,將跟蹤任務視為迴歸問題去解決。主要貢獻包括:①.提出一種收縮損失函式,降低背景資訊中的那些簡單負樣本對損失函式的貢獻;②.使用殘差連線,融合多個卷積層和特徵圖。具體的網路結構如下圖所示:   在上圖中,紅色虛線左

ECCV2018 Deep Regression Tracking with Shrinkage Loss 目標跟蹤收縮損失

Deep Regression Tracking with Shrinkage Loss 論文下載地址:http://suo.im/4ThBkK 論文程式碼:https://github.com/chaoma99/DSLT 本論文是2018 ECCV。   提出問題:深

【小白筆記】目標跟蹤Deep Regression Tracking with Shrinkage Loss

這是ECCV18的一篇文章,使用了深度迴歸網路的框架,引入了收縮損失平衡正負樣本量來提升迴歸網路的效能,文章思路總體比較簡單,下面與大家分享,

part-aligned系列論文:1707.Deep Representation Learning with Part Loss for Person ReID 論文閱讀筆記

Deep Representation Learning with Part Loss for Person ReID 本論文為了更好的提升reid模型在未見過的行人影象判別能力,正對現有大部分只有全域性特徵表達(轉化為分類,一般minimize the em

Information Extraction over Structured Data: Question Answering with Freebase【論文筆記

          Information Extraction over Structured Data:Question Answering with Freebase   一、摘要

VITAL: VIsual Tracking via Adversarial Learning論文筆記

本文是一篇很不錯的關於目標跟蹤演算法的文章,收錄於CVPR2018。 本文主要分析了現有的檢測式跟蹤的框架在模型線上學習過程中的兩個弊病,即: ①、每一幀中正樣本高度重疊,他們無法捕獲物體豐富的變化表徵; ②、正負樣本之間存在嚴重的不均衡分佈的問題;

《Wide & Deep Learning for Recommender Systems》論文筆記

推薦系統 CTR預估 CVR預估 0、概述 線性模型被廣泛地應用於迴歸和分類問題,具有簡單、快速和可解釋性等優點,但是線性模型的表達能力有限,經常需要人工選擇特徵和交叉特徵才能取得一個良好的效果,但是實際工程中的特徵數量會很多,並且還會有大量的稀

ECO: Efficient Convolution Operators for Tracking視訊目標跟蹤論文筆記(PPT版)

論文標題:ECO: Efficient Convolution Operators for Tracking 作者:Martin Danelljan 等 發表會議:CVPR 2017(目前的狀態為已

Joint Deep Learning For Pedestrian Detection(論文筆記-深度學習:行人檢測)

      一、摘要:       行人檢測主要分為四部分:特徵提取、形變處理、遮擋處理和分類。現存方法都是四個部分獨立進行,本文聯合深度學習將四個部分結合在一起,最大化其能力。       二、引言

深度學習Tracking(1)——Learning to Track at 100 FPS with Deep Regression Networks(程式碼理解)

第一次看深度學習網路實現的工程程式碼,有很多內容和結構不理解,並且在Linux下跑網路工程程式碼沒有IDE,無法除錯,我也不知道在檢視函式的時候如何跳轉,因此看整個工程檔案十分麻煩。因此自己也是邊看邊查邊學。 下面開始解析該工程程式碼,可能存在一些偏差和錯

基於自適應彈性網路迴歸的目標跟蹤(OBJECT TRACKING WITH ADAPTIVE ELASTIC NET REGRESSION)閱讀筆記

基於自適應彈性網路迴歸的目標跟蹤(OBJECT TRACKING WITH ADAPTIVE ELASTIC NET REGRESSION)閱讀筆記 by:家行hang 論文連結: Object tracking with adaptive elastic net regressio

論文翻譯:Deep SORT: Simple Online and Realtime Tracking with a Deep Association Metric

相關部落格詳解一:https://blog.csdn.net/cdknight_happy/article/details/79731981  DeepSort論文學習  cdknight_happy 相關部落格詳解二:https://www.cnblogs.com/YiXiao

計算機視覺之目標跟蹤——論文Learning to Track at 100 FPS with Deep Regression Networks

論文解讀 本文采用深度學習迴歸模型GOTURN(Generic Object Tracking Using Regression Networks)解決單目標跟蹤問題。單目標跟蹤問題的難點在於物體的平移、旋轉、大小變化、視角變化、明暗變化、變形以

Regression Tutorial with the Keras Deep Learning Library in Python

Tweet Share Share Google Plus Keras is a deep learning library that wraps the efficient numerica

Deep SORT: Simple Online and Realtime Tracking with a Deep Association Metric

Baseline:SORT SORT:簡單有效 Deep SORT:增加了deep外觀。解決的問題是:長期遮擋和降低IDS(45%)。計算的複雜度主要在離線pre-training階段。該方法具有高幀率的效果(20HZ)。做法: ①離線階段:在大尺度的行人

Occlusion-free Face Alignment: Deep Regression Networks Coupled with De-corrupt AutoEncoders

       這篇論文是我總結的,感覺思路還是不錯的,目前主流的處理影象方式,或者人臉對齊方式都是使用了深度學習,因為深度學習對於人臉對齊具有很好的效果,並且對於遮擋也會有一定的容忍性。 這篇論文是:

GOTURN——Learning to Track at 100 FPS with Deep Regression Networks

文章的題目叫:《Learning to Track at 100 FPS with Deep Regression Networks》  演算法簡稱:GOTURN(Generic Object Tracking Using Regression Networks)  作者是

ECCV 2018 | 曠視科技提出GridFace:通過學習區域性單應變換實現人臉校正

全球計算機視覺三大頂會之一 ECCV 2018(European Conference on Computer Vision)即將於 9 月 8 -14 日在德國慕尼黑拉開帷幕,曠視科技有多篇論文被此大會接收。在這篇論文中,曠視科技提出的一種通過學習區域性單應變換實現人臉校正的全新方法——GridFac

ECCV 2018 論文閱讀筆記——Acquisition of Localization Confidence for Accurate Object Detection

       目標檢測涉及到目標分類和目標定位,但很多基於 CNN 的目標檢測方法都存在分類置信度和定位置信度不匹配的問題。針對這一問題,一種稱之為 IoU-Net 的目標檢測新方法被提出,在基準方法的基礎上實現了顯著的提升。該論文已被將於當地時間 9 月 8

FlowTrack-End-to-end Flow Correlation Tracking with Spatial-temporal Attention(CVPR2018)

動機:大多數DCF方法僅考慮當前幀的特徵,而很少受益於運動和幀間資訊。發生遮擋和形變時,時間資訊缺失導致效能減低。 本文提出FlowTrack,利用連續幀中豐富的光流資訊來改善特徵表示和跟蹤精度。具體是將光流估計,特徵提取,聚合和相關濾波器跟蹤制定為網路中的特殊層,從而實現端到端學習。這種在深度