1. 程式人生 > >理解圖像Garbor和HOG特征的提取方法及實例應用

理解圖像Garbor和HOG特征的提取方法及實例應用

範圍 決定 步長 劃分 尺度 win 自己 而在 空間

前言:今天接觸到了這兩個特征,看了課本和博客後很蒙蔽,沒有理解這兩個特征,本篇博客的目的是只是參考其他的博客總結這兩個特征,如果未來能研究和工作領域是這方面的話再回來自己研學,如有錯誤也歡迎指出。

Garbor特征

一.Gabor 特征的簡介 Gabor 特征是一種可以用來描述圖像紋理信息的特征,Gabor 濾波器的頻率和方向與人類的視覺系統類似,特別適合於紋理表示與判別。Gabor 特征主要依靠 Gabor 核在頻率域上對信號進行加窗,從而能描述信號的局部頻率信息。 說到 Gabor 核,不能不提到傅裏葉變換。正是靠傅裏葉變換,我們才能將信號轉換到頻率域,才能讓Gabor核在頻率域去加窗。而在原本的空間域中,一個 Gabor 核實際上就是一個高斯核與正弦波調制的結果。 如下圖所示,分別為正弦函數,高斯函數,調和後的函數。通過頻率參數和高斯函數參數的選取,Gabor變換可以選取很多紋理特征,但是Gabor是非正交的,不同特征分量之間有冗余。 技術分享圖片

二.Gabor核及其變換 如果從Fourier變換的角度來看,Gobor變換就是窗函數取高斯窗時的短時Fourier變換。 技術分享圖片

技術分享圖片

三.Gabor特征提取 先對圖像I(x,y)進行實數形式的Gabor變換,得到處理後的圖像,直接提取特征的話,特征維數太高,不利於後續處理。一般對圖像分塊,例如:分別水平和垂直方向取16等分,將整個圖像分成64個16x16大小的子圖像塊。 然後計算每一塊對應的能量。 技術分享圖片

計算之後得到聯合空間頻率能量矩陣Energy。最後將能量矩陣降維成1x64的行向量,作為原始圖像在某一方向和尺度變換後的特征向量。

HOG特征

1.算法基本流程   在一幅圖像中,方向梯度直方圖(Histogram of Oriented Gradient, HOG)能夠很好地描述局部目標區域的特征,是一種常用的特征提取方法,HOG+SVM在行人檢測中有著優異的效果。在HOG中,對一幅圖像進行了如下劃分:
圖像(image)->檢測窗口(win)->圖像塊(block)->細胞單元(cells)
流程圖如下: 技術分享圖片


2.計算圖像梯度   對數字圖像而言,每個像素水平和垂直方向的梯度,可以通過下圖的kernels計算:
   技術分享圖片


  即可寫為:
   技術分享圖片


  每個像素梯度大小和方向可表示為:
   技術分享圖片


  其中,I(x,y)是圖像在點(x,y)處的像素值。
  梯度圖像移除了不必要的信息,但是高亮了輪廓線。在每一個像素上,梯度都有大小和方向。對於彩色圖像,3個通道的梯度都將被計算出來,然而圖像素的梯度值為3個通道中最大的梯度值,角度也是最大角度。 3.HOG的win ,block ,cell 技術分享圖片


技術分享圖片

技術分享圖片



  對於圖像中檢測窗口的尺寸為64×64,假設給出塊的尺寸為16×16,塊步長為(8,8),經過計算:檢測窗口中共滑動7×7=49個block。在一個塊中選擇細胞單元不再滑動,給出細胞單元的尺寸為(8,8),所以一個塊中一共有2×2=4個cell。 4.HOG構建方向梯度直方圖與特征向量維數   HOG構建方向梯度直方圖在cell中完成,bins的個數決定了方向的範圍。假設采用9個bin的直方圖來統計這8×8個像素cell的梯度信息,即將cell的梯度方向0~180度(或0~360度,考慮了正負,signed)分成9個方向塊。如下圖所示:如果這個像素的梯度方向是20-40度,直方圖第2個bin即的計數就加1,這樣,對cell內每個像素用梯度方向在直方圖中進行加權投影,將其映射到對應的角度範圍塊內,就可以得到這個cell的梯度方向直方圖了,就是該cell對應的9維特征向量(因為有9個bin)。這邊的加權投影所用的權值為當前點的梯度幅值。例如說:某個像素的梯度方向是20-40度,其梯度幅值是4,那麽直方圖第2個bin的計數就不是加1了,而是加4。這樣就得到關於梯度方向的一個加權直方圖。之前提到過,cell的中方向範圍的個數由bins來決定,還是以9為例:所以,一個cell中的向量為9個。以上面的例子,在一個尺寸為64×64的檢測窗中,描述子的維數就應該為:9×4×49=1764 。其中4為一個block中cell的個數,49為一個win中block的個數。
  技術分享圖片

理解圖像Garbor和HOG特征的提取方法及實例應用