特徵描述子(feature descriptor) —— HOG(方向梯度直方圖)
阿新 • • 發佈:2019-02-15
HOG(Histogram of Oriented Gradients),描述的是影象的區域性特徵,其命名也暗示了其計算方法,先計算影象中某一區域不同方向上梯度的值,然後累積計算頻次,得到直方圖,該直方圖便可代表該區域了,也即從影象中抽取得到的特徵向量,可以作為後續分類器的輸入了。
注意,HOG 刻畫的是影象的區域性特徵,對於一副高解析度影象當然可以直接提取特徵,效果並不理想。從資訊理論的角度說,一幅 640*480 的影象,約有 30 萬個畫素點,直接對原始影象做 HOG 特徵提取的話,按照 360°,分成 360 個bins,HOG 沒有表示這麼大一副影象的能力。從特徵工程的角度看,一般來說,只有影象區域比較小的情況,基於統計原理的直方圖對於該區域才有表達能力
1. 演算法流程
- 影象分塊 ⇒ patches
利用任意一種梯度運算元,sobel、laplacian等,對每一個 patch 進行卷積,計算得到畫素點的梯度方向和幅值:
Mx,y=I2x+I2y−−−−−−√θ(x,y)=tan−1IyIx,∈[0,360°)/[0,180°) 將 360° 分成若干個 bins,例如均分為 16 個 bins,如下: