1. 程式人生 > >目標追蹤論文之狼吞虎嚥(5):基於張量的圖嵌入半監督學習及其在判別式目標追蹤的應用

目標追蹤論文之狼吞虎嚥(5):基於張量的圖嵌入半監督學習及其在判別式目標追蹤的應用

這裡寫圖片描述

一、摘要

作者將一個影象(image patch)看做是一個保留了原始影象結構的二階張量,然後設計了兩個圖來描繪目標和背景所在的張量樣本中固有的區域性幾何結構,從而構建一個判別式嵌入空間。圖嵌入可以在降低張量維度的同時保留著圖的結構。此外,作者提出了兩種思路(?)用來尋找原始張量樣本到基於張量的圖嵌入空間的變換矩陣。為了能夠在嵌入空間編碼出更多的判別資訊,作者提出了基於遷移學習的的半監督策略,用以交替迭代修正嵌入空間,使得其之前獲得的判別資訊遷移過來。演算法應用到目標追蹤中能很好地捕獲目標的外觀特徵,通過粒子濾波估計最優目標狀態。最後,作者在CVPR2013基準資料庫上證明了演算法在追蹤領域上的高效性。

注:半監督學習的基本思想是利用資料分佈上的模型假設建立學習器對未標註樣本進行標註。論文中使用從當前幀收集到的很多未標籤影象塊,來修正判別式嵌入空間。

二、相關工作

影象的向量表示

將影象patch拉伸成為向量,破壞了影象固有的二維結構。

影象的特徵表示

儘管提取的特徵能夠很好用於判別式學習方法中,仍然會有很多有用的資訊會被特徵所遺漏。

影象的矩陣表示

基於張量的子空間學習可以被用到目標追蹤中[11][13][24][25][26],其中一些基於張量的追蹤演算法[13][24][25]在k模展開矩陣中運用PCA降維,[11][26]在k模展開矩陣上運用協方差矩陣特徵值分解。這些演算法存在如下侷限:

  • 子空間學習退化問題;
  • 無法完整檢測到收集到的影象patch在張量形式下固有的區域性幾何和判別資訊;
  • 忽略了背景的影響,當背景和目標相似時會混淆。

注:二維線性判別分析(2DLDA)可以用來檢測二階張量樣本的判別結構,然而,還是不能夠檢測出樣本固有的區域性集合結構,因為2DLDA沒有考慮到同類樣本的變化。
用於降維的圖嵌入提供瞭解決上述侷限的新框架

三、文章的貢獻

基於張量的圖嵌入半監督學習演算法框架如下圖所示:
這裡寫圖片描述

  • 首先,將影象patch看做一個二階張量。在歷史幀中收集已標註的目標和背景樣本,在當前幀中收集未標註樣本;
  • 將這些張量樣本餵給作者提出的圖嵌入半監督學習演算法,訓練出一個基於張量的圖嵌入空間;
  • 然後,在粒子濾波的追蹤框架內實現目標追蹤;
  • 最後,將當前幀的追蹤結果用來更新已標註的樣本集合。

在該演算法中,作者設計了:

  • 一個固有圖用來表示目標張量樣本之間、背景張量樣本之間的關係;
  • 一個懲罰圖用來分離目標張量樣本和背景張量樣本;
  • 圖嵌入降維框架用來尋找原始張量樣本到基於張量的圖嵌入空間的變換矩陣。

由於子空間學習退化問題的存在,該嵌入可能不能包含足夠的判別資訊用於追蹤。為了編碼出更多判別資訊,作者提出,通過用半監督學習的方式,使用未標註的張量樣本來修正基於張量的判別式嵌入空間。
在判別式追蹤中,已有的基於矩陣的方法通過給目標函式增加約束項來修正判別式空間。這種方法很難直接在基於二階張量的圖嵌入學習(需要兩個變換矩陣)中使用,因為很難定義一個合適的正則化器來處理兩個相關的變換矩陣。
作者在文章中提出了在交替迭代下基於遷移學習的半監督改進方法。在每次迭代中,在前一個迭代中最可能被誤判的未標記張量樣本是根據它們與在早期的跟蹤階段收集的標記樣本的相似程度而選擇的。修正後的類標籤被分配給所選的未標記的樣本,並用於學習新的判別嵌入空間,在新嵌入空間中關於目標早期形變的判別資訊得到遷移。從不同的迭代中學習的嵌入空間被線性組合成終極版嵌入空間。
文章的貢獻有以下3點:

  • 提出了一個基於二階張量的圖嵌入學習演算法,使得張量樣本固有的區域性幾何的和判別結構得到很好的表示;
  • 提出了一個基於遷移學習的半監督學習方法,用來修正二階張量圖嵌入空間;
  • 將提出的基於二階張量的半監督圖嵌入學習方法整合到貝葉斯推理框架中,構成了一個追蹤器。

四、基於張量的圖嵌入

4.1 張量操作

張量的內積:
這裡寫圖片描述
張量的k模展開與矩陣M的積:
這裡寫圖片描述<=> C ( k ) = M A ( k )

4.2 基於張量的圖嵌入

圖嵌入演算法使用無向有權圖來描述資料集的流行結構,在保持圖的鄰接關係的前提下,尋找圖在低維空間中的表示,目前很多流行學習演算法都可以統一到這個框架下。
{ X i R I 1 × I 2 × . . . × I n } i = 1 , 2 , . . . , N 表示N個訓練樣本集合,每個樣本是一個n階張量。
固有圖 G 和懲罰圖 G p 用來描述張量樣本的區域性幾何和判別結構。
W W p 分別表示 G G p 的邊權重矩陣,

  • W i j 衡量頂點 X i X j 之間的相似性,固有圖描述了樣本的期望統計或幾何性質(?);
  • W i j p 衡量頂點 X i X j 之間的差異性,懲罰圖描述了被抑制的統計或幾何屬性(?)

基於張量的圖嵌入的任務是尋找一個最優的低維張量表示固有圖中的每個頂點。這樣一個低維張量可以很好地描述頂點間的相似性特徵,使得原始的固有圖的特徵被保留下來,同時懲罰圖所識別的特徵也被抑制了
{ M k R l k × I k } k = 1 , 2 , . . . , n , l k < I k 表示從樣本 { X i } i = 1 , 2 , . . . , N 到N個頂點 { Y i R l 1 × l 2 × . . . × l n } i = 1 , 2 , . . . , N 的n個變換矩陣集合。換句話說, Y i = X i × 1 M 1 × 2 M 2 . . . × n M n

【注】: X i R I 1 × I 2 × . . . × I n Y i R l 1 × l 2 × . . . × l n ,都是n階張量,但是每一階的維度降低了!

通過求解下面的優化問題可以求出一個能保留著圖結構的最優變換矩陣:
這裡寫圖片描述
其中,d是常數。注意目標函式裡是

相關推薦

目標追蹤論文狼吞虎嚥(5):基於嵌入監督學習及其判別式目標追蹤應用

一、摘要 作者將一個影象(image patch)看做是一個保留了原始影象結構的二階張量,然後設計了兩個圖來描繪目標和背景所在的張量樣本中固有的區域性幾何結構,從而構建一個判別式嵌入空間。圖嵌入可以在降低張量維度的同時保留著圖的結構。此外,作者提出了兩種思路(?)用來尋找原始張量樣

目標追蹤論文狼吞虎嚥(4):MCCT演算法

一、創新點 作者提出,單一追蹤器的效能不夠穩定,而從多個追蹤器的決策層得出的融合結果可以有效地提高魯棒性。因此,作者提出一個基於多線索相關濾波的追蹤演算法(MCCT),文章的主要貢獻如下: 提出了一個可以保留多條線索的追蹤演算法,在每一幀中演算法在眾多專家中挑選出一個最可靠的

目標追蹤論文狼吞虎嚥(2):線上被動攻擊學習

最近看STRCF演算法,這是一個克服遮擋和大幅形變的實時視覺追蹤演算法。這篇論文的主要貢獻如下: 通過將空間和時間正則化納入 DCF 框架,提出了 STRCF 模型。基於線上 PA 的 STRCF 不僅可以合理地逼近多幅訓練影象上的 SRDCF 形式,而且在較大的外觀變

目標追蹤論文狼吞虎嚥(1):VITAL演算法

VITAL: VIsual Tracking via Adversarial Learning 一、摘要 當前已有的基於神經網路的目標追蹤演算法大都是基於這樣一個兩階段框架: 先是在目標可能出現的位置附近找出一系列樣本; 然後對這些樣本進行分類,判斷

監督學習(四)——基於監督學習

基於圖的半監督學習   以一個無標籤資料的例子作為墊腳石         Alice正在翻閱一本《Sky and Earth》的雜誌,裡面是關於天文學和旅行的文章。Alice不會英文,她只能通過文章中的圖片來猜測文章的類別。比如第一個故事是“Bridge As

基於神經網路的目標檢測論文神經網路基礎:神經網路的優化方法

注:本文源自本人的碩士畢業論文,未經許可,嚴禁轉載! 原文請參考知網:知網地址 本章節有部分公式無法顯示,詳見原版論文 2.4 神經網路的優化方法 2.4.1 過擬合與規範化 物理學家費米曾說過,如果有四個引數,我可以模擬一頭大象,而如果有五個引數,我還能讓他卷

基於神經網路的目標檢測論文目標檢測系統:實時路況檢測系統的設計與實現

注:本文源自本人的碩士畢業論文,未經許可,嚴禁轉載! 原文請參考知網:知網地址 第五章 實時路況檢測系統的設計與實現 物體識別技術被廣泛應用於人們的生產生活中。隨著深度學習與雲端計算的飛速發展,帶動了物體識別技術產生質的飛躍。高解析度影象和檢測的實時性要求越來越

資料科學個人筆記:推薦系統推薦演算法(基於內容+標籤+監督學習模型)

一、基於內容的模型 (一)推薦系統冷啟動問題 使用者冷啟動:給新使用者推薦 物品冷啟動:新物品被推薦 系統冷啟動:為新開發的網站(還沒有使用者和使用者行為,只有一些物品資訊)設計推薦系統 冷啟動問題的一些解決方案:1.推薦熱門;2.用註冊資訊進行粗粒度的個性化;3.

iOS開發初:根據一gif,返回其中每一幀的圖片陣列(ImageView載入gif))

在APP開發過程中能用到gif圖的地方無非就是重新整理和載入動畫了(等用到小動畫的地方).但是UIImageView是無法直接載入gif圖的,ImageView提供了一個載入動畫圖片陣列的方法..那要有很多幀.png/.jpg的圖片才行…但是像我這種沒有美工的開

監督學習和小目標檢測

在簡書上看到一篇弱監督學習的帖子,由於沒有使用簡書的習慣,因此分享下這篇帖子,感興趣的直接去參考原作者。侵刪 作者:baiyu33 連結:https://www.jianshu.com/p/7b0161975225 來源:簡書   本文收集整理弱監督學習和小目標檢測方面的資料。

[深度學習]監督學習、無監督學習Autoencoders自編碼器(附程式碼)

目錄   自編碼器介紹 從零開始訓練自編碼器 驗證模型訓練結果 視覺化結果 載入預訓練模型 自編碼器介紹 自編碼器的結構簡單,由Encoder和Decoder組成,Encoder產生的Latent variables是潛在變數,它是Decoder的輸入。

[深度學習]監督學習、無監督學習DCGAN深度卷積生成對抗網路(附程式碼)

論文全稱:《Generative Adversarial Nets》 論文地址:https://arxiv.org/pdf/1406.2661.pdf 論文全稱:《UNSUPERVISED REPRESENTATION LEARNING WITH DEEP CONVOLUTIONAL GEN

機器學習監督學習LabelPropagation

機器學習之圖半監督學習LabelPropagation # -*- coding: utf-8 -*- """ Created on Tue Dec 4 12:17:46 2018 @author: muli """ import numpy as np impo

機器學習監督學習LabelSpreading

機器學習之圖半監督學習LabelSpreading # -*- coding: utf-8 -*- """ Created on Tue Dec 4 13:32:30 2018 @author: muli """ import numpy as np import

[深度學習]監督學習、無監督學習Variational Auto-Encoder變分自編碼器(附程式碼)

論文全稱:《Auto-Encoding Variational Bayes》 論文地址:https://arxiv.org/pdf/1312.6114.pdf 論文程式碼: keras 版本:https://github.com/bojone/vae pytorch 版本:https

【深度學習基礎】的描述與深度學習常見

一些概念 深度學習中的所有資料張量的第一個軸都是樣本軸,也稱之為樣本維度。另外,深度學習模型不會同時處理整個資料集,而是將資料拆分成小批量,比如前面的案例就是每次取128個數據作為一個批量。 batch = train_images[:128] # next batch = tr

監督學習self-training

一,半監督學習   半監督學習是一種介於監督式學習和無監督學習之間的學習正規化,我們都知道,在監督式學習中,樣本的類別標籤都是已知的,學習的目的找到樣本的特徵與類別標籤之間的聯絡。一般來講訓練樣本的數量越多,訓練得到的分類器的分類精度也會越高。但是在很多現實問

深度學習第一篇論文——監督學習Mean Teacher 的學習

   最近一個月剛接觸深度學習,導師給了一篇論文(mean teacher)讓我先理解然後跑論文裡面的程式碼,這個過程中我出現了很多問題,借這篇blog記錄下來,也是鼓勵自己接著學下去。Mean Teacher 的論文地址:https://arxiv.org/abs/1703

NEAT(基於NEAT-Python模組)實現監督學習和強化學習

NEAT (NeuroEvolution of Augmenting Topologies) 是一種遺傳演算法,能夠對神經網路的引數和形態進行進化。    NEAT(NeuroEvolution of Augmenting Topologies)是一種建立人工神經網路的進化演

論文解讀】【監督學習】【Google教你水論文】A Simple Semi-Supervised Learning Framework for Object Detection

題記:最近在做LLL(Life Long Learning),接觸到了SSL(Semi-Supervised Learning)正好讀到了谷歌今年的論文,也是比較有點開創性的,淺顯易懂,對比實驗豐富,非常適合缺乏基礎科學常識和剛剛讀研不會寫論文的同學讀一讀,觸類旁通嘛。   這篇論文思路等等也非常適合剛剛開始