【技術向】目標跟蹤DSST改進版fDSST演算法程式碼分析

阿新 • • 發佈：2019-01-04

MD大神的fDSST是DSST的加速改進版，文章發表在TPAMI17上先給文章地址：

http://www.cvl.isy.liu.se/en/research/objrec/visualtracking/scalvistrack/DSST_TPAMI.pdf

fDSST程式碼matlab在作者主頁有提供：http://www.cvl.isy.liu.se/en/research/objrec/visualtracking/scalvistrack/index.html

fDSST的加速主要體現在PCA將尺度特徵維度縮減。

程式碼分析：

run_tracker.m部分程式碼沒有區別主要完成了視訊資料載入初始化引數等，fDSST.m程式碼中體現了與DSST的區別。

下面是初始化的尺度部分，主要建立了17個尺度變化因子和33個內插尺度變化因子，並且建立了尺度迴歸目標ys和尺度cos窗，其它則是一些細節的考慮

可以看到這些與二維影象的初始化沒有本質的差別，就是換成一維的操作，將二維影象向量化則變成了一維。

if nScales > 0
    scale_sigma = nScalesInterp * scale_sigma_factor;
    
    scale_exp = (-floor((nScales-1)/2):ceil((nScales-1)/2)) * nScalesInterp/nScales;
    scale_exp_shift = circshift(scale_exp, [0 -floor((nScales-1)/2)]);
    
    interp_scale_exp = -floor((nScalesInterp-1)/2):ceil((nScalesInterp-1)/2);
    interp_scale_exp_shift = circshift(interp_scale_exp, [0 -floor((nScalesInterp-1)/2)]);
    
    scaleSizeFactors = scale_step .^ scale_exp;
    interpScaleFactors = scale_step .^ interp_scale_exp_shift;
    
    ys = exp(-0.5 * (scale_exp_shift.^2) /scale_sigma^2);
    ysf = single(fft(ys));
    scale_window = single(hann(size(ysf,2)))';
    
    %make sure the scale model is not to large, to save computation time
    if scale_model_factor^2 * prod(init_target_sz) > scale_model_max_area
        scale_model_factor = sqrt(scale_model_max_area/prod(init_target_sz));
    end
    
    %set the scale model size
    scale_model_sz = floor(init_target_sz * scale_model_factor);
    
    im = imread(s_frames{1});
    
    %force reasonable scale changes
    min_scale_factor = scale_step ^ ceil(log(max(5 ./ sz)) / log(scale_step));
    max_scale_factor = scale_step ^ floor(log(min([size(im,1) size(im,2)] ./ base_target_sz)) / log(scale_step));
    
    max_scale_dim = strcmp(params.s_num_compressed_dim,'MAX');
    if max_scale_dim
        s_num_compressed_dim = length(scaleSizeFactors);
    else
        s_num_compressed_dim = params.s_num_compressed_dim;
    end
end

在後面的迴圈中主要思路就是提取特徵，訓練得到模型引數，提取下一幀影象patch的特徵，利用訓練好的模型計算響應，得到下一幀的位置和尺度，如此迴圈；

尺度的計算可以認為與位置的計算是分開的，尺度資訊就是一個值：當前幀尺度因子，乘上固定的初始size則是當前幀的size；

我們先看尺度訓練程式碼部分，在後半部

if nScales > 0
        
        %create a new feature projection matrix
        [xs_pca, xs_npca] = get_scale_subwindow(im, pos, base_target_sz, currentScaleFactor*scaleSizeFactors, scale_model_sz);
        %上面一句提取了17個不同尺度的patch再統一resize到scale_model_sz大小,然後再分別提取這些patch的hog特徵，將hog特徵拉成一維的
        %最後輸出的xs_pca是17個一維的hog向量，用於後面的降維，後面的那個變數沒用，是空的
        if frame == 1
            s_num = xs_pca;
        else
            s_num = (1 - interp_factor) * s_num + interp_factor * xs_pca;
        end;
        %上面兩句用於特徵的更新，目的使模型對於跟蹤目標的魯棒性變強
        bigY = s_num;
        bigY_den = xs_pca;
        
        if max_scale_dim
            [scale_basis, ~] = qr(bigY, 0);
            [scale_basis_den, ~] = qr(bigY_den, 0);
        else
            [U,~,~] = svd(bigY,'econ');
            scale_basis = U(:,1:s_num_compressed_dim);
        end
        scale_basis = scale_basis';
        %上面使用奇異值分解得到pca變換矩陣，原始碼中將維度最大化壓縮從744維到17維
        %create the filter update coefficients
        sf_proj = fft(feature_projection_scale([],s_num,scale_basis,scale_window),[],2);
        sf_num = bsxfun(@times,ysf,conj(sf_proj));
        %通過降維得到的模型矩陣只有17*17大小，獲得了極大加速
        xs = feature_projection_scale(xs_npca,xs_pca,scale_basis_den',scale_window);
        xsf = fft(xs,[],2);
        new_sf_den = sum(xsf .* conj(xsf),1);
        
        if frame == 1
            sf_den = new_sf_den;
        else
            sf_den = (1 - interp_factor) * sf_den + interp_factor * new_sf_den;
        end;
        %更新模型，和特徵更新的原因相同
    end

再來看看檢測部分的尺度程式碼

if nScales > 0
            
            %create a new feature projection matrix
            [xs_pca, xs_npca] = get_scale_subwindow(im,pos,base_target_sz,currentScaleFactor*scaleSizeFactors,scale_model_sz);
            
            xs = feature_projection_scale(xs_npca,xs_pca,scale_basis,scale_window);
            xsf = fft(xs,[],2);
            %提取待檢測patch的不同尺度的特徵並且降維，pca矩陣用的也是訓練部分的那個矩陣
            scale_responsef = sum(sf_num .* xsf, 1) ./ (sf_den + lambda);
            %計算響應，這是個17維的向量
            interp_scale_response = ifft( resizeDFT(scale_responsef, nScalesInterp), 'symmetric');
            %內插分出了33維的相應的向量
            recovered_scale_index = find(interp_scale_response == max(interp_scale_response(:)), 1);
            %找到響應值最大的所對應的那個尺度因子
            %set the scale
            currentScaleFactor = currentScaleFactor * interpScaleFactors(recovered_scale_index);
            %adjust to make sure we are not to large or to small
            if currentScaleFactor < min_scale_factor
                currentScaleFactor = min_scale_factor;
            elseif currentScaleFactor > max_scale_factor
                currentScaleFactor = max_scale_factor;
            end
            %對尺度因子做合理性判斷
 end

綜上得到了尺度因子，注意得到的位置偏移也要乘上這個因子

最後得到了當前幀的最佳size

target_sz = floor(base_target_sz * currentScaleFactor);

在我的機器上跑個dog的demo達到了55fps，i5的電腦，還是很快的，歡迎各位與我討論~

【技術向】目標跟蹤DSST改進版fDSST演算法程式碼分析

MD大神的fDSST是DSST的加速改進版，文章發表在TPAMI17上先給文章地址： http://www.cvl.isy.liu.se/en/research/objrec/visualtracking/scalvistrack/DSST_TPAMI.pdf f

【技術向】DSST目標跟蹤演算法Matlab程式碼執行指南

論文：Accurate Scale Estimation for Robust Visual Tracking(DSST) 1.執行環境 win8.1+matlabR2015a 2.準備工作將code下載至電腦任意位置，檢視一下檔案，進入目錄D:\DSST_c

【技術向】KCF目標跟蹤演算法Matlab程式碼執行指南

核化相關濾波目前較為流行，便試著跑一下作者João F. Henriques提供的matlab程式碼，一開始各種不成功，在網上也沒有解答。下面把我跑成功的經驗和大家分享。執行環境 win8.1+matlabR2014a 準備工作將程式

【技術向】Linux伺服器下Matlab無許可權安裝指南

文章目錄 1.安裝前的準備 1.1原料下載： 1.2解壓 1.3配置Java 2.安裝我在網路上看了一些部落格，覺得有的介紹有點多餘且版本過老不適用，現根據我的經驗分享一下安裝流

【Python+OpenCV】目標跟蹤-實現基本的運動檢測

目標跟蹤是對攝像頭視訊中的移動目標進行定位的過程，有著非常廣泛的應用。實時目標跟蹤是許多計算機視覺應用的重要任務，如監控、基於感知的使用者介面、增強現實、基於物件的視訊壓縮以及輔助駕駛等。有很多實現

【小白筆記】目標跟蹤 Real-Time MDNet

文章目錄 1.主要貢獻 2.知識準備 2.1 MDNet 2.2 ROIAlign 3.改進 3.1 網路結構 3.2 自適應的ROIAlign 3.

【小白筆記】目標跟蹤LADCF(VOT2018)

文章目錄 1. 主要貢獻 2. 方法 2.1模型 2.2優化 2.3 跟蹤框架 3 實驗這是VOT18比賽中獲得優異成績的一個演算法，在short-term中EAO為第一，

【小白筆記】目標跟蹤Deep Regression Tracking with Shrinkage Loss

這是ECCV18的一篇文章，使用了深度迴歸網路的框架，引入了收縮損失平衡正負樣本量來提升迴歸網路的效能，文章思路總體比較簡單，下面與大家分享，

【小白筆記】目標跟蹤(Unveiling the Power of Deep Tracking)論文筆記

1.主要貢獻這篇文章18年四月份掛在Arxiv上，現在中了ECCV18，是Martin作為3作的一篇文章，效能比ECO提升了一大截。下面就來說一下這篇文章吧，有不對的地方歡迎一起討論~ 貢獻1：該論文探究了深度特徵和手工特徵分別對目標跟蹤的影響，主要分析了

【技術分享】手把手教你使用PowerShell內置的端口掃描器

別名 target 實例 white tcpclient 提升是否 ddb sans 【技術分享】手把手教你使用PowerShell內置的端口掃描器引言想做端口掃描，NMAP是理想的選擇，但是有時候NMAP並不可用。有的時候僅僅是想看一下某個端口是否開放。

【新手向】TensorFlow 安裝教程：RK3399上運行谷歌人工智能

on() 總結 apt 朋友 alt 小型 start light 做了從AlphaGo大勝柯潔後，谷歌的人工智能備受關註。人工智能好像離我們好遠，深度學習算法貌似非常復雜。但其實看看你的手機上的語音助手，相機上的人臉識別，今日頭條上幫你自動篩選出來的新聞，還有各大音樂軟

【技術案例】Firefly-RK3399多路視頻編解碼

code 準備能夠攝像頭 target 視頻處理 wid 1-1 Firefly-RK3399開源板擁有強大的視像處理器（VPU），能夠流暢的實現H.264編解碼功能，可以同時進行兩路視頻編碼和五路視頻解碼。在應用方面，多路編解碼功能可以更優秀地應用於同時錄像和播放多

【正常向】正式比賽前的熱身賽需要測的內容清單

【技術翻譯】支持向量機簡明教程及其在python和R下的調參

sel machine 線性線上 ont 投影 vars 不一定 .cn 原文: Simple Tutorial on SVM and Parameter Tuning in Python and R 介紹數據在機器學習中是重要的一種任務，支持向量機(SVM)

【新手向】什麽是“框架”？

隨筆一派胡言如果你開始接觸編程，肯定會聽說“框架”這個詞，“Django”、“Spring”、“TensorFlow”、“Flask”這些名字也隨處可見。我一度被這些概念困擾，畢竟它們不像clojure，kotlin一樣是名字奇怪的編程語言，而是“基於某種語言”；它們的介紹裏會開門見山地說“這是一

【技術積累】樹形結構的循環查找實現案例1

解決實現 return tom 所有 UNC custom ext lis 無限級服務端數據組織方案的實現，提供解決方案，其中數據庫查詢可替換為List的方式查找等其它方式。 function queryAllSubCustomers($cstId) {$sqlA=&qu

【技術課堂】如何管理MongoDB數據庫？

ffffff color god ces vpd ado mar b數 fff 【技術課堂】如何管理MongoDB數據庫？

【技術累積】【點】【java】【22】UUID

人工一鍵偽隨機 all tail blog ike article 唯一性基礎概念&使用 UUID是Universally Unique Identifier的縮寫，它是在一定的範圍內（從特定的名字空間到全球）唯一的機器生成的標識符。說白了就是個唯一鍵，

【技術累積】【點】【java】【23】super以及重寫重載

uno 用法總結不能 www. ati stat () ref java關鍵字重寫和重載重寫是繼承之後的Override 重載是同一個方法，有著不同的入參出參這樣子； super 當需要在子類中調用父類的被重寫方法時，要使用super關鍵字。當然只要是調用父

【技術累積】【點】【java】【28】Map遍歷

兩種 bject amp urn 明顯 for object 一次 keyset Map遍歷 map的遍歷一般有幾種吧遍歷entrySet for(Map.Entry<String,String> entry : map.entrySet()){

【技術向】目標跟蹤DSST改進版fDSST演算法程式碼分析

相關推薦