影象特徵描述子之ORB

阿新 • • 發佈：2019-01-26

ORB(Oriented FAST and Rotated BRIEF)演算法是對FAST特徵點檢測和BRIEF特徵描述子的一種結合，在原有的基礎上做了改進與優化，使得ORB特徵具備多種區域性不變性，併為實時計算提供了可能。

特徵點檢測

ORB首先利用FAST演算法檢測特徵點，然後計算每個特徵點的Harris角點響應值，從中篩選出N個最大的特徵點，Harris角點的響應函式如下：

R=detM−α(traceM)2
相關內容已在博文FAST角點檢測和Harris角點檢測分別做了詳細的介紹。
FAST檢測特徵點不具備尺度不變性，可以像SIFT特徵一樣，藉助尺度空間理論構建影象高斯金字塔，然後在每一層金字塔影象上檢測角點，以實現尺度不變性。對於旋轉不變性，原論文中提出了一種利用影象矩(幾何矩)，在半徑為r的鄰域內求取灰度質心的方法，從特徵點到灰度質心的向量，定義為該特徵點的主方向。影象矩定義如下：
m

pq=Σx,yxpyqI(x,y),x,y∈[−r,r]
I(x,y)表示畫素灰度值，0階矩m00即影象鄰域視窗內所有畫素的灰度和，m10和m01分別相對x和相對y的一階矩，因此影象區域性鄰域的中心矩或者質心可定義為
C=(m10m00,m01m00)
特徵點與質心形成的向量與X軸的夾角定義為特徵點的主方向
θ=arctan(m01,m10)

特徵點描述

ORB採用BRIEF作為特徵描述方法，BRIEF雖然速度優勢明顯，但也存在一些缺陷，例如不具備尺度不變性和旋轉不變性，對噪聲敏感。尺度不變性的問題在利用FAST檢測特徵點時，通過構建高斯金字塔得以解決。BRIEF中採用9×9的高斯卷積核進行濾波降噪，可以在一定程度上緩解噪聲敏感問題；ORB中利用積分影象，在31

×31的Patch中選取隨機點對，並以選取的隨機點為中心，在5×5的視窗內計算灰度平均值(灰度和)，比較隨機點對的鄰域灰度均值，進行二進位制編碼，而不是僅僅由兩個隨機點對的畫素值決定編碼結果，可以有效地解決噪聲問題。
至於旋轉不變性問題，可利用FAST特徵點檢測時求取的主方向，旋轉特徵點鄰域，但旋轉整個Patch再提取BRIEF特徵描述子的計算代價較大，因此，ORB採用了一種更高效的方式，在每個特徵點鄰域Patch內，先選取256對隨機點，將其進行旋轉，然後做判決編碼為二進位制串。n個點對構成矩陣S

S=[x1y1x2y2……x2ny2n]
旋轉矩陣Rθ為
Rθ=[cosθsinθ

−sinθcosθ]
旋轉後的座標矩陣為
Sθ=RθS

描述子的區分性

通過上述方法得到的特徵描述子具有旋轉不變性，稱為steered BRIEF(sBRIEF)，但匹配效果卻不如原始BRIEF演算法，因為可區分性減弱了。特徵描述子的一個要求就是要儘可能地表達特徵點的獨特性，便於區分不同的特徵點。如下圖所示，為幾種特徵描述子的均值分佈，橫軸為均值與0.5之間的距離，縱軸為相應均值下特徵點的統計數量。可以看出，BRIEF描述子所有位元位的均值接近於0.5，且方差很大；方差越大表明可區分性越好。不同特徵點的描述子表現出較大的差異性，不易造成無匹配。但steered BRIEF進行了座標旋轉，損失了這個特性，導致可區分性減弱，相關性變強，不利於匹配。

為了解決steered BRIEF可區分性降低的問題，ORB使用了一種基於學習的方法來選擇一定數量的隨機點對。首先建立一個大約300k特徵點的資料集(特徵點來源於PASCAL2006中的影象)，對每個特徵點，考慮其31×31的鄰域Patch，為了去除噪聲的干擾，選擇5×5的子視窗的灰度均值代替單個畫素的灰度，這樣每個Patch內就有N=(31−5+1)×(31−5+1)=27×27=729個子視窗，從中隨機選取2個非重複的子視窗，一共有M=C2N中方法。這樣，每個特徵點便可提取出一個長度為M的二進位制串，所有特徵點可構成一個300k×M的二進位制矩陣Q，矩陣中每個元素取值為0或1。現在需要從M個點對中選取256個相關性最小、可區分性最大的點對，作為最終的二進位制編碼。篩選方法如下：
- 對矩陣Q的每一列求取均值，並根據均值與0.5之間的距離從小到大的順序，依次對所有列向量進行重新排序，得到矩陣T
- 將T中的第一列向量放到結果矩陣R中
- 取出T中的下一列向量，計算其與矩陣R中所有列向量的相關性，如果相關係數小於給定閾值，則將T中的該列向量移至矩陣R中，否則丟棄
- 迴圈執行上一步，直到R中有256個列向量；如果遍歷T中所有列，R中向量列數還不滿256，則增大閾值，重複以上步驟。

這樣，最後得到的就是相關性最小的256對隨機點，該方法稱為rBRIEF。

Experiment & Result

OpenCV實現ORB特徵檢測與描述

#include <opencv2/core/core.hpp> 
#include <opencv2/highgui/highgui.hpp> 
#include <opencv2/imgproc/imgproc.hpp> 
#include <opencv2/features2d/features2d.hpp>

using namespace cv;

int main(int argc, char** argv) 
{ 
    Mat img_1 = imread("box.png"); 
    Mat img_2 = imread("box_in_scene.png");

    // -- Step 1: Detect the keypoints using STAR Detector 
    std::vector<KeyPoint> keypoints_1,keypoints_2; 
    ORB orb; 
    orb.detect(img_1, keypoints_1); 
    orb.detect(img_2, keypoints_2);

    // -- Stpe 2: Calculate descriptors (feature vectors) 
    Mat descriptors_1, descriptors_2; 
    orb.compute(img_1, keypoints_1, descriptors_1); 
    orb.compute(img_2, keypoints_2, descriptors_2);

    //-- Step 3: Matching descriptor vectors with a brute force matcher 
    BFMatcher matcher(NORM_HAMMING); 
    std::vector<DMatch> mathces; 
    matcher.match(descriptors_1, descriptors_2, mathces); 
    // -- dwaw matches 
    Mat img_mathes; 
    drawMatches(img_1, keypoints_1, img_2, keypoints_2, mathces, img_mathes); 
    // -- show 
    imshow("Mathces", img_mathes);

    waitKey(0); 
    return 0; 
}

OpenCV中ORB演算法的部分原始碼實現

//計算Harris角點響應  
static void HarrisResponses(const Mat& img, vector<KeyPoint>& pts, int blockSize, float harris_k)  
{  
    CV_Assert( img.type() == CV_8UC1 && blockSize*blockSize <= 2048 );  

    size_t ptidx, ptsize = pts.size();  

    const uchar* ptr00 = img.ptr<uchar>();  
    int step = (int)(img.step/img.elemSize1());  
    int r = blockSize/2;  

    float scale = (1 << 2) * blockSize * 255.0f;  
    scale = 1.0f / scale;  
    float scale_sq_sq = scale * scale * scale * scale;  

    AutoBuffer<int> ofsbuf(blockSize*blockSize);  
    int* ofs = ofsbuf;  
    for( int i = 0; i < blockSize; i++ )  
        for( int j = 0; j < blockSize; j++ )  
            ofs[i*blockSize + j] = (int)(i*step + j);  

    for( ptidx = 0; ptidx < ptsize; ptidx++ )  
    {  
        int x0 = cvRound(pts[ptidx].pt.x - r);  
        int y0 = cvRound(pts[ptidx].pt.y - r);  

        const uchar* ptr0 = ptr00 + y0*step + x0;  
        int a = 0, b = 0, c = 0;  

        for( int k = 0; k < blockSize*blockSize; k++ )  
        {  
            const uchar* ptr = ptr0 + ofs[k];  
            int Ix = (ptr[1] - ptr[-1])*2 + (ptr[-step+1] - ptr[-step-1]) + (ptr[step+1] - ptr[step-1]);  
            int Iy = (ptr[step] - ptr[-step])*2 + (ptr[step-1] - ptr[-step-1]) + (ptr[step+1] - ptr[-step+1

 
 
              
           
              
              
            
            相關推薦
			   
            
            
            
 

    

    
    影象特徵描述子之ORB
      
							
							
							

  ORB(Oriented FAST and Rotated BRIEF)演算法是對FAST特徵點檢測和BRIEF特徵描述子的一種結合，在原有的基礎上做了改進與優化，使得ORB特徵具備多種區域性不變性，併為實時計算提供了可能。 


特徵點檢測

  OR 

  
 

    

    
    影象特徵描述子之BRIEF
      
							
							
							

  BRIEF(Binary Robust Independent Elementary Features)是一種對已檢測到的特徵點進行表示和描述的特徵描述方法，和傳統的利用影象區域性鄰域的灰度直方圖或梯度直方圖提取特徵的方式不同，BRIEF是一種二進位制編 

  
 

    

    
    影象處理-常用特徵點檢測方法以及特徵描述子
      
							
							
							HOG(histogram of gradient)





sift(Scale-invariant feature transform)


sift是用於描述影象中的區域性特徵，在空間尺度中尋找極值點，並且提取出其位置、尺度、旋轉不變數，因此具有尺度和旋 

  
 

    

    
    【機器學習--opencv3.4.1版本基於Hog特徵描述子Svm對經典手寫數字識別】
       
 
  方向梯度直方圖（Histogram of Oriented Gradient, HOG）特徵是一種在計算機視覺和影象處理中用來進行物體檢測的特徵描述子。HOG特徵通過計算和統計影象區域性區域的梯度方向直方圖來構成特徵。 
 
#include <iostream>

#inc 

  
 

    

    
    3D特徵描述子SHOT詳解
      在3D點雲目標識別中，除了傳統的利用二維影象來輔助識別，然後對映到3D的方式；學術界在十幾年前就開始研究3D點雲的特徵描述子。 
本文主要詳解義大利博洛尼亞大學教授提出的SHOT（Signature of Histogram of  Orientation）http://www.vision.dei 

  
 

    

    
    自編碼器深度分析+定製特徵描述子構建初探
       
 
 
 1. 關於tailored 特徵描述子 
         自從深度學習的繁榮，利用自編碼器、孿生網路、對抗網路採用資料驅動的形式設計tailored 特徵描述子 成為了計算機視覺領域發展的重要推動力， 這不僅大大削弱了特徵工程的壓力，而且降低了相關領域學 

  
 

    

    
    OpenCv-C++-特徵描述子（BruteForce（暴力匹配））
       
  
  
 本片文主要是通過BFMatcher()來進行特徵匹配，暴力匹配就是在一個數組或連結串列裡面進行一一查詢，迴圈匹配。如下圖：  
 通過SURF運算元分別找到兩張影象的特徵點，再使用BFMatcher函式對兩張影象上的特徵點進行一一檢測和計算，最後通過drawMatches函式繪製兩張影象之間 

  
 

    

    
    影象特徵描述與匹配（一）——BRIEF特徵點描述與匹配
       
 
          傳統的特徵點描述子如SIFT,SURF描述子，每個特徵點採用128維(SIFT)或者64維(SURF)向量去描述，每個維度上佔用4位元組，SIFT需要128×4=512位元組記憶體，SURF則需要256 

  
 

    

    
    opencv筆記（1）——特徵點檢測之ORB特徵提取
       
  
  
 ORB演算法原理解讀 
 #include <iostream>
#include "opencv2/core/core.hpp"
#include "opencv2/features2d/features2d.hpp"
#include "opencv2/highgui/hig 

  
 

    

    
    BRIEF 特徵描述子
      Binary Robust Independent Elementary Features    1. BRIEF的基本原理  我們已經知道SIFT特徵採用了128維的特徵描述子，由於描述子用的浮點數，所以它將會佔用512 bytes的空間。類似地，對於SURF特徵，常見的是64維的描述子，它也將佔用256b 

  
 

    

    
    SIFT演算法特徵描述子構建---關鍵點定位原理及程式碼
      
							
							
							0.引言


  sift針對區域性特徵進行特徵提取，在尺度空間尋找極值點，提取位置，尺度，旋轉不變數，生成特徵描述子。


總共分四個步驟：



step2 關鍵點/極值點提取



2.1 關鍵點位置初步探查

生成DOG金字塔後，要找到DOG空間中的區域 

  
 

    

    
    sift演算法特徵描述子構建程式碼實現--梯度直方圖生成原理及程式碼
      
							
							
							0.引言


  sift針對區域性特徵進行特徵提取，在尺度空間尋找極值點，提取位置，尺度，旋轉不變數，生成特徵描述子。


總共分四個步驟：



step3 生成梯度直方圖

生成特徵點的梯度資訊，並且確定主方向和輔助主方向的關鍵點。



3.1 梯度計算 

  
 

    

    
    從特徵描述子到深度學習：計算機視覺的20年曆程 From feature descriptors to deep learning: 20 years of computer vision
      
We all know that deep convolutional neural networks have produced some stellar results on object detection and recognition benchmarks in the past two year 

  
 

    

    
    特徵描述子評測
      
在高斯模糊的測試中，我模擬的運動模糊（當攝像機突然移動時會發生的），在這項測試中，所有的描述子都表現出很好的結果，說結果好，我的意思是更大的高斯核大小，會導致更小的正確匹配百分比

Lighting test



在光照變化測試中，影象的不同僅僅在於整幅影象的亮度，所有的描述子都表現不錯。主要的原因是所有 

  
 

    

    
    【特徵匹配】BRIEF特徵描述子原理及原始碼解析
      
                




轉載請註明出處： http://blog.csdn.net/luoshixian099/article/details/48338273
  傳統的特徵點描述子如SIFT,SURF描述子，每個特徵點採用128維(SIFT)或者64維(SURF)向量去描述，每個維度上 

  
 

    

    
    特徵描述子（-）—HOG具體實現過程
      
                

       方向梯度直方圖（Histogram of Oriented Gradient, HOG）特徵是一種在計算機視覺和影象處理中用來進行物體檢測的特徵描述子。它通過計算和統計影象區域性區域的梯度方向直方圖來構成特徵。其提取演算法具體實現過程如下：
1.影象灰度化處 

  
 

    

    
    SIFT演算法特徵描述子構建---特徵描述子構建原理及程式碼
      
							
							
							0.引言


  sift針對區域性特徵進行特徵提取，在尺度空間尋找極值點，提取位置，尺度，旋轉不變數，生成特徵描述子。


總共分四個步驟：







4 特徵描述子構建

每個關鍵點的方向、位置、尺度資訊都具備後，可以對區域性特徵進行描述，即特徵描述子。 

  
 

    

    
    【opencv基於特徵描述子的物體檢驗尋找】
      
                關於特徵子中經常用的的函式：findHomography，estimateRigidTransform

關於opencv的特徵描述子，我們需要了解DMatch與KPoints的資料結構，如下：

DMatch結構體

/* 
 * Struct for matching:  

  
 

    

    
    三維計算機視覺（五）--特徵描述子
      
                
PPF
機器人視覺中有一項重要人物就是從場景中提取物體的位置，姿態。影象處理演算法藉助Deep Learning 的東風已經在影象的物體標記領域耍的飛起了。而從三維場景中提取物體還有待研究。目前已有的思路是先提取關鍵點，再使用各種區域性特徵描述子對關鍵點進行描述，最後與待檢 

  
 

    

    
    特徵描述子（feature descriptor） —— HOG（方向梯度直方圖）
      
							
							
							HOG（Histogram of Oriented Gradients），描述的是影象的區域性特徵，其命名也暗示了其計算方法，先計算影象中某一區域不同方向上梯度的值，然後累積計算頻次，得到直方圖，該直方圖便可代表該區域了，也即從影象中抽取得到的特徵向量，可以作為