1. 程式人生 > >DSST目標跟蹤演算法

DSST目標跟蹤演算法

    DSST演算法也是基於KCF演算法改的較好的一種。DSSTAccurate Scale Estimation for RobustVisual Tracking)是2015年BMVC(InProceedings of the British Machine Vision Conference)上的文章,並在2014VOT比賽中奪得了第一名,演算法簡潔,效能優良,可移植性高。之篇文章是基於MOSSE,KCF基礎上的改進,主要有兩個方面:(1)引入多特徵融合機制,這個和SAMF演算法一樣,使用的特徵為HOG+CN+灰度特徵;(2)文中最大的創新點是對於尺度的改進。

   (1)本文首先介紹了MOSSE演算法的主要原理推導:



    首先從目標中提取一系列的影象,記為f1f2,…,fn作為訓練樣本,其對應的濾波器響應值為一系列的高斯函式g1g2,…,gn,而目的就是找到滿足最小均方差的最優濾波器。

     根據Parseval定理可以得出,等式左側是時間域的方程式,右側是傅立葉域的方程式,將時域轉化為頻域進行求解可得。

     轉化在頻域進行計算的優點是:在頻域計算可以大大的加快運算效率,滿足實時性的要求。在算出濾波器後,在新的一幀中逐步輸入候選樣本z,計算得分,選擇最高分的位置即是目標的新位置。    

    (2)然後介紹了關於特徵改進的思想:


     文中提到的特徵融合方法同SAMF一樣,就是簡單的將一維特徵擴充到多維,l表示改變後特徵的維度。文中提到可以進行融合的特徵由HOG,CN,灰度特徵。但是在實驗環節中,考慮到實時性的原因,作者僅僅採用了HOG特徵。

(3)尺度自適應的改進:

    本文演算法的核心部分是實現尺度自適應。作者提出三維濾波器,我第一次看的時候感覺很嚇人,三維是什麼……但是在實際上三維是由兩部分組成的:一維維尺度濾波器;二維位置濾波器。這樣就很好理解了,兩個濾波器相互獨立,這樣可以更加的高效,方便於將尺度估計與其他演算法相結合。也是本文的一大亮點。

原理圖如下:

    分兩步進行計算,首先和KCF一樣,用一個濾波器進行跟蹤,得到目標的位置。然後在目標位置的基礎上通過調整跟蹤框的比例來找到響應值最大的尺度,從而在小範圍內實現尺度自適應。這種演算法的特點是可移植性強,分別進行目標位置估計與尺度估計,兩個步驟不受任何影響,可以移植到其它演算法中。


    其中,P,R分別為目標在前一幀的寬高,a=1.02為尺度因子,S=33為尺度的數量。上述尺度不是線性關係,而是由精到粗(從內到外的方向)的檢測過程。

    最後進行了實驗分析:簡要介紹了系統的引數設定以及評估標準,由於考慮了演算法的實時性,使用HOG特徵進行試驗分析對       論文地址:

http://219.216.82.193/cache/6/03/www.cvl.isy.liu.se/58feb2d936e8dad216dd39f7752908a7/ScaleTracking_BMVC14.pdf

    程式碼地址:http://www.cvl.isy.liu.se/en/research/objrec/visualtracking/scalvistrack/index.html