1. 程式人生 > >論文筆記:Visual Object Tracking based on Adaptive Siamese and Motion Estimation Network

論文筆記:Visual Object Tracking based on Adaptive Siamese and Motion Estimation Network

 Visual Object Tracking based on Adaptive Siamese and Motion Estimation  

 

本文提出一種利用上一幀目標位置座標,在本幀中找出目標可能出現的位置的網路--motion estimation network (named MEN)  。在產生候選位置時,本文從兩個可能的座標下手,採用高斯分佈產生很多候選框。然後將候選框送進Siamese Network進行相似性對比。

作者選用最近幾幀的目標作為匹配物件(Buffer),提升魯棒性。

本文的網路架構基於SINT 結構,加了可變的buffer,提前訓練一個權重卷積神經網路(WCNN)。

本文跟蹤框架如下圖所示:

 

整個網路由兩部分組成:一個用於提取前幾幀目標的特徵,一個用於提取當前幀的特徵。

為了保留時空資訊,作者將conv-3,conv-4,conv-5卷積層的池化層去掉,同時利用不同卷積層的特徵進行匹配。