1. 程式人生 > >基於Deep Learning的跟蹤演算法總結(二)

基於Deep Learning的跟蹤演算法總結(二)

本文主要談談TCNN(樹狀CNN)實現物體跟蹤演算法的大致流程和原理。

論文:《Modeling and Propagating CNNs in a Tree Structure for Visual Tracking》,應該是投了CVPR2017。
論文地址:https://arxiv.org/pdf/1608.07242.pdf

論文的大體方法請參考:https://zhuanlan.zhihu.com/p/25312524
鑑於論文的思路比較簡單,公式不多,建議直接看論文,這裡不再具體敘述。本文僅粗略談談本文的實現過程和亮點。

模型原理:

首先我們看一下TCNN的結構:
這裡寫圖片描述

先看左邊的(a),直觀上,多個CNN組成了常見的樹狀結構。
第一次這個圖的時候有一個困惑,CNN究竟是怎麼組成樹狀結構的呢?難道是多個CNN提取特徵,再加權求和嗎?

其實這個在論文摘要裡已經提到了,由最原始的CNN起,基於某種方式產生新的CNN,這種方式是,每隔10幀跟新一次模型,每次更新都將產生一個新的CNN結點,而這個新的CNN的父結點,則按照某種方式(具體請參閱論文)選擇。新的CNN由過去的那10幀對父結點CNN的全連線層進行finetune得到

樹狀結構保持10個CNN結點,超過的結點保留新結點,刪除舊結點(這個好像計算結點與當前幀的相關性得到的)。

另外,需要注意的是,同時使用這個多CNN結構,引數和計算量都可想而知,所以,論文提出的解決辦法是:所有CNN結點的卷積層引數一致,因為功能都是提取基本的特徵,它們的區別在於最後的全連線層是由不同幀finetune而來,所以CNN中的大部分引數只需要保留一次。

最後的輸出結果由當前樹狀結構裡的10個CNN加權求和得到,減少了跟蹤物體出現漂移變形導致跟蹤失敗的風險。

相關推薦

基於Deep Learning跟蹤演算法總結

本文主要談談TCNN(樹狀CNN)實現物體跟蹤演算法的大致流程和原理。 論文:《Modeling and Propagating CNNs in a Tree Structure for Visual Tracking》,應該是投了CVPR2017。 論文地

基於Deep Learning跟蹤演算法總結

博主最近主要關注使用深度學習的視訊跟蹤一系列演算法,本文為學習筆記,僅供學習交流,如有侵權,請指出。 No Free Lunch 不同於檢測、識別等視覺領域深度學習一統天下的趨勢,深度學習在目標跟蹤領域的應用並非一帆風順。其主要問題在於訓練資料的缺失。深

基於Deep Learning跟蹤演算法總結

題外話:博主這段時間忙於辦理簽證,比較忙,一直沒時間看論文。:-( 一、引言 深度學習具有強大的能力,但由於目標跟蹤任務本身的特殊性,深度學習一直沒能很好地發揮出自己的潛能。其中,導致深度學習演算法速度慢的一個重要原因是online-update,即更新過程

Deep Learning論文筆記之Sparse Filtering稀疏濾波

structure 分布 的確 tlab bolt 期望 有一個 尋找 mean Deep Learning論文筆記之(二)Sparse Filtering稀疏濾波 自己平時看了一些論文,但老感覺看完過後就會慢慢的淡忘,某一天重新拾起來的時候又好像沒有

機器學習 演算法總結 調參技巧

偏差和方差 在統計學習框架下,Error = Bias + Variance。Error指的模型的預測錯誤率,由兩部分組成,一部分是由於模型太簡單而帶來的估計不準確的部分(Bias),另一部分是由於模型太複雜而帶來的更大的變化空間和不確定性(Variance)。 如果要降低模型的Bi

TLD目標跟蹤演算法學習

  正如名字所示,TLD演算法主要由三個模組構成:追蹤器(tracker),檢測器(detector)和機器學習(learning)。   對於視訊追蹤來說,常用的方法有兩種,一是使用追蹤器根據物體在上一幀的位置預測它在下一幀的位置,但這樣會積累誤差,而且一旦物體在影象中

影象拼接演算法總結

2、特徵提取與匹配 OpenCV中關於SURF演算法的部分,常常涉及到的是SURF、SurfFeatureDetector、SurfDescriptorExtractor這三個類; features2d.hpp標頭檔案中,有:typedef SURF SurfFeature

基於深度學習的目標檢測演算法綜述截止20180821

參考:https://zhuanlan.zhihu.com/p/40020809 基於深度學習的目標檢測演算法綜述分為三部分: 1. Two/One stage演算法改進。這部分將主要總結在two/one stage經典網路上改進的系列論文,包括Faster R-CNN、YOLO、SSD等經

系統學習機器學習之總結--機器學習演算法比較

轉自:https://blog.csdn.net/bryan__/article/details/52026214 其實這篇文章真正出處來自:csuldw 本文主要回顧下幾個常用演算法的適應場景及其優缺點! 機器學習演算法太多了,分類、迴歸、聚類、推薦、影象識別領域等等,要想找到一個合適演算

基於深度學習的目標檢測演算法綜述

前言 基於深度學習的目標檢測演算法綜述分為三部分: 1. Two/One stage演算法改進。這部分將主要總結在two/one stage經典網路上改進的系列論文,包括Faster R-CNN、YOLO、SSD等經典論文的升級版本。 2. 解決方案。這部分論文對物體檢

七大排序演算法的個人總結

歸併排序(Merge Sort):   歸併排序是一個相當“穩定”的演算法對於其它排序演算法,比如希爾排序,快速排序和堆排序而言,這些演算法有所謂的最好與最壞情況。而歸併排序的時間複雜度是固定的,它是怎麼做到的? 兩個有序陣列的合併: 首先來看歸併排序要解決的第一個問題:兩

基於深度學習的目標檢測演算法綜述—Two/One stage演算法改進之R-FCN

基於深度學習的目標檢測演算法綜述(一):https://blog.csdn.net/weixin_36835368/article/details/82687919 目錄 1、Two stage 1.1 R-FCN:Object Detection via Region-based

測試開發工程師面試總結——演算法

演算法也屬於常見面試內容之一,但基本不會超過《劍指offer》的範圍,在此附上一篇簡書上整理的內容: 第二版java解法 常見的面試題包括以下幾類:字串操作,檔案輸入輸出流及統計,矩陣操作,單例模式等。 1.針對字串的操作:如字串反轉、

關於2015阿里移動推薦演算法大賽的總結——推薦演算法

雖然開始走錯了路,但是也學到了東西,美團技術團隊的文件還是不錯的,喜歡的童鞋可以經常去瞅瞅,後面我會給連結的~~~~ —————————————————————————————————————————————————————————————— 具體流程 基本流程如

資料結構與演算法學習總結

1.什麼是複雜度分析? (1)資料結構和演算法解決是“如何讓計算機更快時間、更省空間的解決問題”。 (2)因此需要從執行時間和佔用空間兩個維度來評估資料結構和演算法的效能。 (3)分別用時間複雜度和空間複雜度兩個概念描述效能問題,二者統稱為複雜度。 (4)複雜度描述的

機器視覺學習總結—— LDA,PCA演算法與應用

//***************************** Face Recognize *********************************** void train(){ // load training data nTrainFaces = loadFace

Nginx總結基於ip的虛擬主機配置

前面講了如何安裝配置Nginx,大家可以去這裡看看nginx系列文章:https://www.cnblogs.com/zhangweizhong/category/1529997.html 今天要說的是Nginx如何配置虛擬主機。   1. 什麼是虛擬主機    &nb

遠程協助開發總結

控制 amp 為什麽不能 username 開發 col dsc exce nec 遠程協助開發的過程中繼續總結 針對開發總結一的問題,改正了一些地方 1.圖像和命令采用兩個套接字,為什麽不能采用一個套接字?遠程協助是快頻的通信,圖像需要不間斷的從受控端發送到控制端,發送接

.net Kafka.Client多個Consumer Group對Topic消費不能完全覆蓋研究總結

eight 分享 stat .com ima topic consumer 閱讀 padding 依據Partition和Consumer的Rebalance策略,找到Kafka.Client Rebalance代碼塊,還原本地環境,跟蹤調試,發現自定義Consumer G

命令和符號總結

命令2017-05-13隨記—————————————————————————————— 20.uname 顯示系統內核信息 -r 顯示內核版本 -m 32位,64位本文出自 “一個Linux小白-學習運維” 博客,謝絕轉載!命令和符號總結(二)