論文筆記：Visual Object Tracking based on Adaptive Siamese and Motion Estimation Network

阿新 • • 發佈：2018-11-27

Visual Object Tracking based on Adaptive Siamese and Motion Estimation

本文提出一種利用上一幀目標位置座標，在本幀中找出目標可能出現的位置的網路--motion estimation network (named MEN) 。在產生候選位置時，本文從兩個可能的座標下手，採用高斯分佈產生很多候選框。然後將候選框送進Siamese Network進行相似性對比。

作者選用最近幾幀的目標作為匹配物件（Buffer），提升魯棒性。

本文的網路架構基於SINT 結構，加了可變的buffer，提前訓練一個權重卷積神經網路（WCNN）。

本文跟蹤框架如下圖所示：

整個網路由兩部分組成：一個用於提取前幾幀目標的特徵，一個用於提取當前幀的特徵。

為了保留時空資訊，作者將conv-3，conv-4，conv-5卷積層的池化層去掉，同時利用不同卷積層的特徵進行匹配。

論文筆記：Visual Object Tracking based on Adaptive Siamese and Motion Estimation Network

Visual Object Tracking based on Adaptive Siamese and Motion Estimation 本文提出一種利用上一幀目標位置座標，在本幀中找出目標可能出現的位置的網路--motion es

論文筆記：Deep Attentive Tracking via Reciprocative Learning

Deep Attentive Tracking via Reciprocative Learning NIPS18_tracking Type:Tracking-By-Detection 本篇論文地主要創新是在將注意機制引入到目標跟蹤摘要：源自認知神經科學地視覺注意促進人類對相關的內

論文筆記：Is object localization for free?

Is object localization for free? Weakly-supervised learning with convolutional neural networks 摘要提出一個弱監督卷積神經網路for 分類。主要貢獻有：

論文閱讀：Multiple Object Tracking Using K-Shortest Paths Optimization, PAMI2011

引文：多目標跟蹤問題通常分為兩步：第一步是與時間無關的目標檢測，即針對每一視訊幀檢測出目標出現的位置，以及在這些位置上出現的置信度；第二步是在時間軸上連線候選目標形成軌跡，在生成軌跡時要儘可能保證同一條軌跡上的所有目標對應同一個真實物體，軌跡數量對應目標

論文筆記：TextBoxes: A Fast Text Detector with a Single Deep Neural Network

在自然場景中，場景文字（Scene text）是最常見的視覺物件（visual objects）之一。經常出現在路標，車牌，產品包裝袋上等等。閱讀場景文字產生了很多有用的應用，例如基於圖片的地理定位（image-basedgeolocation）。儘管它和傳統的OCR很相似，但是場景文字的閱讀更具有挑戰性，因

論文筆記：Perceptual Losses for Real-Time Style Transfer and Super-Resolution[doing]

1.transformation: image to image 2.perceptual losses: psnr是per-pixel的loss,值高未必代表圖片質量好，廣泛應用只是因為

論文筆記：目標追蹤-CVPR2014-Adaptive Color Attributes for Real-time Visual Tracking

exploit orm dom ons tail red 最好早期形式化基於自適應顏色屬性的目標追蹤 Adaptive Color Attributes for Real-Time Visual Tracking 基於自適應顏色屬性的實時視覺追蹤 3月講的第一

論文筆記：Fisher Kernels on Visual Vocab ularies for Image Categorization

Fisher Kernels on Visual Vocabularies for Image Categorization 論文連結：CVPR 2006 在模式分類領域，Fisher Vector（FV）是一個強有力的構架，因為他結合了生成式（概率密

論文筆記：Empirical Evaluation of Gated Recurrent Neural Networks on Sequence Modeling

感想最近深度學習面試的時候，有個面試官問了我LSTM，我一下子傻眼了，確實不怎麼好懂，學LSTM已經有半年的時間了，但是對這個玩意兒卻還不怎麼明白，可能是沒用過它的緣故吧，我找了一篇它和GRU比較的論文，這篇論文沒有從理論上證明哪個模型的好壞，只是從實驗，應用場景的角度發現GRU在一些場景比LST

論文筆記：Learning Region Features for Object Detection

中心思想繼Relation Network實現可學習的nms之後，MSRA的大佬們覺得目標檢測器依然不夠fully learnable，這篇文章類似之前的Deformable ROI Pooling，主要在ROI特徵的組織上做文章，文章總結了現有的各種ROI Pooling變體，提出了一個統一的數學表示式

(DaSiamRPN)Distractor-aware Siamese Networks for Visual Object Tracking 閱讀筆記

2018年的VOT競賽結果已出，基於深度特徵(Deep Feature)的相關濾波依舊強勢，但值得注意的是，基於孿生網路(Siamese Network)的方法異軍突起，在主賽上有不俗表現的同時，在實時

論文筆記：雙線性模型《Bilinear CNN Models for Fine-Grained Visual Recognition》

雙線性模型是2015年提出的一種細粒度影象分類模型。該模型使用的是兩個並列的CNN模型，這種CNN模型使用的是AlexNet或VGGNet去掉最後的全連線層和softmax層，這個作為特徵提取器，然後使用SVM作為最後的線性分類器。當然，作者還在實驗中嘗試了多種方法，比如最後使用softmax但

論文筆記：Feature Pyramid Networks for Object Detection

初衷 Feature pyramids are a basic component in recognition systems for detecting objects at different scales. But recent deep

論文筆記：An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application

1.歷史方法 1）基於字元的DCNN,比如photoOCR.單個字元的檢測與識別。要求單個字元的檢測器效能很強，crop的足夠好。 2）直接對圖片進行分類。9萬個單詞，組合成無數的單詞，無法直接應用 3）RNN,訓練和測試均不需要每個字元的位置。但是需要預處理，從圖片得到特

論文筆記 R-FCN: Object Detection via Region-based Fully Convolutional Networks

插一句，我又回來啦~ 這篇論文主要採用“位置敏感度圖”的方法，將FCN 網路引入到目標檢測中來，將影象分類和目標檢測很好地結合。因此這種方法可以和很多FCN中的影象分類框架結合，比如ResNets等，

論文筆記：MatchNet: Unifying Feature and Metric Learning for Patch-Based Matching

Abstract MatchNet：一個用來從patches中提取特徵的深度卷積網路 + 一個用來比較提取出的特徵相似度的三層全連結網路構成。 Introduction 在MatchNet中，每個patch輸入卷積網路，生成一個固定維度的類似

論文筆記 | R-FCN: Object Detection via Region-based Fully Convolutional Networks

Jifeng Dai，Yi Li，Kaiming He，Jian Sun 代季峰程式碼裡還有百度雲盤的連線，為國人考慮的真周到~ （更新，作者又給出了end2end版本，現有三版code 包括mxnet版： https://github.com

論文筆記-DeepFM: A Factorization-Machine based Neural Network for CTR Prediction

contain feature 比較 san date res 離散 edi post 針對交叉（高階）特征學習提出的DeepFM是一個end-to-end模型，不需要像wide&deep那樣在wide端人工構造特征。網絡結構： sparse feature

論文筆記：Fast(er) RCNN

這也物體檢測因此 sele 疑惑修正 width 輸入重點在 RCNN 初步試水取得成功後，研究人員又迅速跟進，針對 RCNN 中的幾點不足提出改進，接連推出了 fast-rcnn 和 faster-rcnn。關於這兩篇論文，網上相關的文章實在是多如牛毛，因此，本

論文筆記：時間序列分析

論文筆記：Causal Inference on EventSequences 論文綜述解決的問題：兩個不同的序列xn與yn，是否能斷定他們相互關聯，或者說存在因果關係。依託的主要知識：概率論名詞解釋：格蘭傑因果關係 Granger c

論文筆記：Visual Object Tracking based on Adaptive Siamese and Motion Estimation Network

相關推薦