1. 程式人生 > >論文筆記:Deep Attentive Tracking via Reciprocative Learning

論文筆記:Deep Attentive Tracking via Reciprocative Learning

 

Deep Attentive Tracking via Reciprocative Learning

NIPS18_tracking

Type:Tracking-By-Detection

本篇論文地主要創新是在將注意機制引入到目標跟蹤

摘要:源自認知神經科學地視覺注意促進人類對相關的內容的感知。近些年大量工作將注意機制引入到計算機視覺系統中。對於視覺跟蹤來說,面臨的最大問題在於目標外表的大尺度變化。自注圖通過選擇性關注臨時的魯棒特徵提升視覺跟蹤的效能。當前的一些檢測跟蹤演算法主要使用額外的自注模型來生成特徵權重,然而分類器並沒有採用自注機制。在本文章=中,我們提出一種 

reciprocative learning algorithm 演算法在訓練深度分類器時探索視覺自注機制。該演算法由前饋與反饋操作兩部分來產生自注圖,該圖作為正則項與分類LOSS一起訓練。該深度分類器習得關注目標區域特徵。相關的實驗結果證實了該演算法達到了極佳的跟蹤效果。

引言

近年來。針對不同的視覺應用由此發展出各種各樣的跟蹤演算法,其中視覺注意在視訊中目標跟蹤起了很大的作用。例如基於DCF的跟蹤演算法用一張高斯響應特徵圖表示輸入的特徵。很多人採用經驗空間權重抑制由傅立葉變換過程中的邊界效應。從視覺注意角度來說,空間權重也是自注圖的一種表現形式。當目標由大尺度變化時,這種空間權重自注圖就無法過多的注意邊界的響應,從而錯誤的目標定位。

另一方面,two-stage tracking-by-detection 方法首先採集大量樣本,對每一樣本進行分類判斷前景還是背景。視覺注意在這一方面有很大的潛能。現存的深度跟蹤演算法大多利用額外的注意模型來生成特徵權重。自注機制需要經常以便可以學習到目標的最新特徵,可以更好的將目標與背景區分。在本文中,作者直接訓練一個自注分類器,整個訓練過程包括前饋和反饋兩步。在前饋這一步中,將圖片輸入網路,得到分類score;在反饋這一步中,將第一層網路的導數作為自注圖(attention map),將自注圖作為一個正則項作為LOSS函式中的一員進行訓練。網路引數採用傳統的反向傳播進行更新。因此該深度分類器可以有效的學習目標相關區域的特徵,同時有效地減少了背景的干擾。在測試的過程本網路的權重不進行更新,僅僅輸出分類的score。

本文的主要貢獻:

  1. 提出一個用於視覺自注的學習演算法
  2. 將自注圖作為loss函式的一項進行訓練,使其關注目標的特徵
  3. 通過與其他演算法在相關資料集上的對比,我們的演算法在效能上取得不錯的結果

 

本文提出的跟蹤演算法訓練過程