1. 程式人生 > >低秩矩陣在機器視覺中的理解--Low-Rank representations

低秩矩陣在機器視覺中的理解--Low-Rank representations

閱讀論文Learning Structured Low-rank Representations for Image Classification

文章主要有兩個創新點

1.在普通的低秩表示外另外加了對低秩表示的係數需要稀疏,這個的物理意義就是使得得出的低秩表示矩陣更有有分類性,更加表徵它屬於哪一類。

2。加入了一個低秩的約束,先給出了一個理想化的低秩表示的形式,再使得我們求解的低秩表示接近理想化的低秩表示。

最後得出瞭如下(5)的公式

1.解決問題:學習一種結構化的低秩表示方法來進行影象分類,可以不用逐類逐類得進行影象分類而是一次性憑藉結構資訊和稀疏性來分類

2.前人工作:原始的學習字典大,計算量大,而且需要對每個輸入的訊號都要獨立地編碼,即使他們來自同一個類,有相同的特徵。這樣就沒有充分利用結構化資訊。

3.解決方案:訓練集的標記資訊合併到字典學習的過程,同一類的影象具有低秩結構,稀疏性就能幫助區分影象屬於哪個類

低秩矩陣的恢復:X=A+E具體描述如(1)A是要低秩的,E是稀疏的


我們需要對x進行低秩矩陣恢復,得到主成分DZ和稀疏錯誤E,在消除了噪聲後,每個類中的樣本能夠被證明具有相似的基本結構,所以我們的係數就也對應有相似性,所以我們要約束Z為低秩的,並且Z的結構如下

所以我們的目標就是:

給出一個最優分解的情況:

如果Xi屬於類L,那麼對於字典DL處的係數qi處都為1,其他地方都為0.

所以我們加入標籤的學習,把包含結構資訊的一個規則相加入目標函式中||Z-Q||,字典希望Z能夠接近於Q


4.實驗結果:(訓練和測試集都可以是受汙染的資料)

a.低秩矩陣恢復的過程


b.識別率比較


有遮擋的低秩矩陣的恢復(該論文的方法能夠將遮擋的物體分離到噪聲成分)


下圖主要揭示了我們的方法能夠很清晰的揭示結構資訊通過係數表示的相似性


5.啟發:通過一個低秩矩陣的恢復,得到的係數表示是可區分的,既能夠揭示結構資訊,又可以用來直接分類。