1. 程式人生 > >影象特徵提取(類似於綜述)

影象特徵提取(類似於綜述)


        空間關係特徵的使用可加強對影象內容的描述區分能力,但空間關係特徵常對影象或目標的旋轉、反轉、尺度變化等比較敏感。另外,實際應用中,僅僅利用空間資訊往往是不夠的,不能有效準確地表達場景資訊。為了檢索,除使用空間關係特徵外,還需要其它特徵來配合。 

(二)常用的特徵提取與匹配方法 

        提取影象空間關係特徵可以有兩種方法:一種方法是首先對影象進行自動分割,劃分出影象中所包含的物件或顏色區域,然後根據這些區域提取影象特徵,並建立索引;另一種方法則簡單地將影象均勻地劃分為若干規則子塊,然後對每個影象子塊提取特徵,並建立索引。 
姿態估計問題就是:確定某一三維目標物體的方位指向問題。姿態估計在機器人視覺、動作跟蹤和單照相機定標等很多領域都有應用。 


        在不同領域用於姿態估計的感測器是不一樣的,在這裡主要講基於視覺的姿態估計。 

        基於視覺的姿態估計根據使用的攝像機數目又可分為單目視覺姿態估計和多目視覺姿態估計。根據演算法的不同又可分為基於模型的姿態估計和基於學習的姿態估計。 

一、基於模型的姿態估計方法 

        基於模型的方法通常利用物體的幾何關係或者物體的特徵點來估計。其基本思想是利用某種幾何模型或結構來表示物體的結構和形狀,並通過提取某些物體特徵,在模型和影象之間建立起對應關係,然後通過幾何或者其它方法實現物體空間姿態的估計。這裡所使用的模型既可能是簡單的幾何形體,如平面、圓柱,也可能是某種幾何結構,也可能是通過鐳射掃描或其它方法獲得的三維模型。 


        基於模型的姿態估計方法是通過比對真實影象和合成影象,進行相似度計算更新物體姿態。目前基於模型的方法為了避免在全域性狀態空間中進行優化搜尋,一般都將優化問題先降解成多個區域性特徵的匹配問題,非常依賴於區域性特徵的準確檢測。當噪聲較大無法提取準確的區域性特徵的時候,該方法的魯棒性受到很大影響。 

二、基於學習的姿態估計方法

        基於學習的方法藉助於機器學習(machine learning)方法,從事先獲取的不同姿態下的訓練樣本中學習二維觀測與三維姿態之間的對應關係,並將學習得到的決策規則或迴歸函式應用於樣本,所得結果作為對樣本的姿態估計。基於學習的方法一般採用全域性觀測特徵,不需檢測或識別物體的區域性特徵,具有較好的魯棒性。其缺點是由於無法獲取在高維空間中進行連續估計所需要的密集取樣,因此無法保證姿態估計的精度與連續性。 


        基於學習的姿態估計方法源於姿態識別方法的思想。姿態識別需要預先定義多個姿態類別,每個類別包含了一定的姿態範圍;然後為每個姿態類別標註若干訓練樣本,通過模式分類的方法訓練姿態分類器以實現姿態識別。 

        這一類方法並不需要對物體進行建模,一般通過影象的全域性特徵進行匹配分析,可以有效的避免區域性特徵方法在複雜姿態和遮擋關係情況下出現的特徵匹配歧義性問題。然而姿態識別方法只能將姿態劃分到事先定義的幾個姿態類別中,並不能對姿態進行連續的精確的估計。 

        基於學習的方法一般採用全域性觀測特徵,可以保證演算法具有較好的魯棒性。然而這一類方法的姿態估計精度很大程度依賴於訓練的充分程度。要想比較精確地得到二維觀測與三維姿態之間的對應關係,就必須獲取足夠密集的樣本來學習決策規則和迴歸函式。而一般來說所需要樣本的數量是隨狀態空間的維度指數級增加的,對於高維狀態空間,事實上不可能獲取進行精確估計所需要的密集取樣。因此,無法得到密集取樣而難以保證估計的精度與連續性,是基於學習的姿態估計方法無法克服的根本困難。 

        和姿態識別等典型的模式分類問題不同的是,姿態估計輸出的是一個高維的姿態向量,而不是某個類別的類標。因此這一類方法需要學習的是一個從高維觀測向量到高維姿態向量的對映,目前這在機器學習領域中還是一個非常困難的問題。 

        特徵是描述模式的最佳方式,且我們通常認為特徵的各個維度能夠從不同的角度描述模式,在理想情況下,維度之間是互補完備的。 

        特徵提取的主要目的是降維。特徵抽取的主要思想是將原始樣本投影到一個低維特徵空間,得到最能反應樣本本質或進行樣本區分的低維樣本特徵。 

       一般影象特徵可以分為四類:直觀性特徵、灰度統計特徵、變換系數特徵與代數特徵。 

        直觀性特徵主要指幾何特徵,幾何特徵比較穩定,受人臉的姿態變化與光照條件等因素的影響小,但不易抽取,而且測量精度不高,與影象處理技術密切相關。 

        代數特徵是基於統計學習方法抽取的特徵。代數特徵具有較高的識別精度,代數特徵抽取方法又可以分為兩類:一種是線性投影特徵抽取方法;另外一種是非線性特徵抽取方法。 

        習慣上,將基於主分量分析和Fisher線性鑑別分析所獲得的特徵抽取方法,統稱為線性投影分析。 

       基於線性投影分析的特徵抽取方法,其基本思想是根據一定的效能目標來尋找一線性變換,把原始訊號資料壓縮到一個低維子空間,使資料在子空間中的分佈更加緊湊,為資料的更好描述提供手段,同時計算的複雜度得到大大降低。線上性投影分析中,以主分量分析(PCA,或稱K-L變換)和Fisher線性鑑別分析(LDA)最具代表性,圍繞這兩種方法所形成的特徵抽取演算法,已成為模式識別領域中最為經典和廣泛使用的方法。 

        線性投影分析法的主要缺點為:需要對大量的已有樣本進行學習,且對定位、光照與物體非線性形變敏感,因而採集條件對識別效能影響較大。 

        非線性特徵抽取方法也是研究的熱點之一。“核技巧”最早應用在SVM中,KPCA和KFA是“核技巧”的推廣應用。 

        核投影方法的基本思想是將原樣本空間中的樣本通過某種形式的非線性對映,變換到一個高維甚至無窮維的空間,並藉助於核技巧在新的空間中應用線性的分析方法求解。由於新空間中的線性方向也對應原樣本空間的非線性方向,所以基於核的投影分析得出的投影方向也對應原樣本空間的非線性方向。 

        核投影方法也有一些弱點:幾何意義不明確,無法知道樣本在非顯式對映後變成了什麼分佈模式;核函式中引數的選取沒有相應選擇標準,大多數只能採取經驗引數選取;不適合訓練樣本很多的情況,原因是經過核對映後,樣本的維數等於訓練樣本的個數,如果訓練樣本數目很大,核對映後的向量維數將會很高,並將遇到計算量上的難題。 

         就應用領域來說,KPCA遠沒有PCA應用的廣泛。如果作為一般性的降維KPCA確實比PCA效果好,特別是特徵空間不是一般的歐式空間的時候更為明顯。PCA可以通過大量的自然圖片學習一個子空間,但是KPCA做不到。