iOS開發之opencv學習筆記四：使用feature2d識別圖片

阿新 • • 發佈：2019-01-03

使用過vuforia或者亮風臺的朋友應該知道，這兩個平臺對圖片的跟蹤的準備工作是很簡單的，只需要幾張樣本圖片就可以做了。

但是按照上篇的介紹，如果用CascadeClassifier進行物體跟蹤就需要非常非常多的樣本，那麼，要對圖片進行識別跟蹤就沒有像上面說的兩個平臺那樣簡便的辦法嗎？

答案是可以選擇feature2d。

1.feature2d是什麼？

字面上就很容易理解，feature2d是做2d影象的特徵處理的。比如我們可以用它做指紋取樣、識別，影象的角點提取，影象的跟蹤等等。

這個模組就在opencv的modules/feature2d裡面。

2.用feature2d做圖片跟蹤需要準備什麼？

說這個之前，先要說一下nonfree模組，我在第一篇提到過這個。

影象的特徵提取有很多演算法，有些演算法並非由opencv提供，opencv提出了特徵提取，比對的準則，而大多演算法是由opencv的使用者們完成的。

在opencv2.x，這些演算法都放在nonfree模組裡，但是到了opencv3.x，nonfree模組就被去掉了。取而代之的是opencv_contrib庫，它同樣一個使用BSD協議的開源庫。

遺憾的是，目前筆者找到的opencv_contrib只能在x86系統上成功編譯，也就是說目前還不支援像android,iOS這樣的使用arm架構的系統。

然而，我們要做的功能只是用了它其中的xfeature2d模組，這只是它諸多模組中的之一，而且跟其他模組沒有任何耦合。

沒錯，我們完全可以把xfeature2d的原始碼單獨做一個庫，然後用在我們的功能裡。筆者已經成功編譯出了一個xfeature2d的靜態庫，然而，限於版權問題，這裡就不上程式碼了。

大家自己動動靈活的小腦袋吧。

3.一切準備就緒，然後怎麼做？

既然要做圖片跟蹤，當然先要做圖片對比，那麼怎麼做圖片的對比呢？我們使用特徵點對比，這樣我們先要做的就是用feature2d提取圖片的特徵點。

特徵點提取的演算法有很多，筆者用過的大體有這三個：SURF,SIFT,ORB。在這裡我就介紹SIFT演算法吧，我更願意稱之為運算元（因為聽起來很專業嘛）。

這三種運算元有何區別呢？我可以很大膽的告訴你：不清楚。

我不研究它們的工作原理，哪個好用用哪個，這是我一貫的作風。

跟第二篇一樣，做一個攝像頭預覽的ViewController。

我們需要一張樣本圖片，就是我們需要識別跟蹤的圖片，用這張圖片建立一個灰度cv::Mat。

NSString *imp = [[NSBundle mainBundle] pathForResource:ifn ofType:@"jpg"];

            
            Mat gray = imread([imp cStringUsingEncoding:NSUTF8StringEncoding], IMREAD_GRAYSCALE);

建立一個detector跟extractor，用這個detector來提取一個KeyPoint陣列，extractor提取一個descriptor

vector<KeyPoint> keypoints;
            Mat descriptor;

Ptr<SIFT> detector = SIFT::create();
            detector->detect(gray, keypoints);
            
            Ptr<SIFT> extractor = SIFT::create();
            extractor->compute(gray, keypoints, descriptor);

這時候樣本的特徵就取好了。

在取到攝像頭幀之後，做第二篇一樣的處理，得到一個Mat，然後灰化

Mat image, gray;
image = [得到的mat];
cvtColor(image,gray,CV_BGR2GRAY);

同樣，用SIFT運算元提取這張灰度圖的特徵kp，d。

vector<KeyPoint> kp;
        Mat d;
Ptr<SIFT> detector = SIFT::create();
        detector->detect(gray, kp);
        
        if (kp.size() <= 0) {
            return;
        }
        
        Ptr<SIFT> extractor = SIFT::create();
        extractor->compute(gray, kp, d);

為什麼要判斷kp.size()？因為你的攝像頭可能會得到一張純色毫無輪廓角點的圖片，這樣kp.size()就是0，這就沒必要做對比了。

接下來就可以做對比，得到一個DMatch陣列

vector<DMatch> matches;
BFMatcher matcher = BFMatcher();
matcher.match(descriptor, d, matches);

從DMatch數組裡面照到最小和最大distance

double maxDist = 0.0;
            double minDist = DBL_MAX;
            for (int i=0;i<matches.size();i++) {
                
                DMatch match = matches[i];
                double dist = match.distance;
                if (dist < minDist) {
                    minDist = dist;
                }
                if (dist > maxDist) {
                    maxDist = dist;
                }
            }

過濾distance過大的DMatch

double maxGoodMatchDist = THRESHOLD * minDist;
            vector<DMatch> goodMatches;
            for( int i = 0; i <descriptor.rows; i++ )
            {
                if( matches[i].distance < maxGoodMatchDist ){
                    goodMatches.push_back(matches[i]);
                }
            }

這裡的THERSHOLD視運算元而定，SIFT可以設成2。根據過濾好的DMatch陣列再來過濾不吻合的keypoint，分別得到樣本和當前取到的幀裡面吻合的點

vector<cv::Point> modePoints;
            vector<cv::Point> scenePoints;
            
            for (int i=0;i<goodMatches.size();i++) {
                
                DMatch goodMatche = goodMatches[i];
                
                if (goodMatche.queryIdx < 0 || goodMatche.queryIdx >= keypoints.size()) {
                    continue;
                }
                
                if (goodMatche.trainIdx < 0 || goodMatche.trainIdx >= kp.size()) {
                    continue;
                }
                
                modePoints.push_back(keypoints[goodMatche.queryIdx].pt);
                scenePoints.push_back(kp[goodMatche.trainIdx].pt);
            }

得到一個homeography

Mat homography = findHomography(modePoints, scenePoints, CV_RANSAC);

找到四個邊界點

                if (homography.data == NULL) {
                    return;
                }
                
                std::vector<Point2f> objCorners(4);
                objCorners[0] = cvPoint(0,0);
                objCorners[1] = cvPoint( mode.mat.cols, 0 );
                objCorners[2] = cvPoint( mode.mat.cols, mode.mat.rows );
                objCorners[3] = cvPoint( 0, mode.mat.rows );
                
                std::vector<Point2f> sceneCorners(4);
                perspectiveTransform( objCorners, sceneCorners, homography);
                
                if (!(sceneCorners[1].x > sceneCorners[0].x
                      && sceneCorners[2].y > sceneCorners[1].y
                      && sceneCorners[3].x < sceneCorners[2].x
                      && sceneCorners[0].y < sceneCorners[3].y)) {

                    return;
                }

最後的判斷是判斷這四個邊界點是否能夠形成一個四邊形。然後利用這四個點畫一個四邊形覆蓋到預覽圖層

dispatch_async(dispatch_get_main_queue(), ^{
                    
                    UIGraphicsBeginImageContext(CGSizeMake(img.size.width, img.size.height));
                    CGContextRef contextRef = UIGraphicsGetCurrentContext();
                    
                    CGContextSetLineWidth(contextRef, 4);
                    CGContextSetRGBStrokeColor(contextRef, 1.0, 0.0, 0.0, 1);
                    
                    CGContextMoveToPoint(contextRef, sceneCorners[0].x, sceneCorners[0].y);
                    CGContextAddLineToPoint(contextRef, sceneCorners[1].x, sceneCorners[1].y);
                    CGContextAddLineToPoint(contextRef, sceneCorners[2].x, sceneCorners[2].y));
                    CGContextAddLineToPoint(contextRef, sceneCorners[3].x, sceneCorners[3].y));
                    CGContextAddLineToPoint(contextRef, sceneCorners[0].x, sceneCorners[0].y);
                    
                    CGContextStrokePath(contextRef);
                    
                    UIImage *rectImage = UIGraphicsGetImageFromCurrentImageContext();
                    _overlayImageView.image = rectImage;
                   
                    UIGraphicsEndImageContext();
                });

這樣就可以看到一個紅框框跟著樣本圖後面跑了。

iOS開發之opencv學習筆記四：使用feature2d識別圖片

使用過vuforia或者亮風臺的朋友應該知道，這兩個平臺對圖片的跟蹤的準備工作是很簡單的，只需要幾張樣本圖片就可以做了。但是按照上篇的介紹，如果用CascadeClassifier進行物體跟蹤就需要非常非常多的樣本，那麼，要對圖片進行識別跟蹤就沒有像上面說的兩個平臺那樣

iOS開發之opencv學習筆記一：下載和安裝

1. opencv是什麼？ opencv是一個基於BSD開源協議的影象處理開源庫，截止本人編輯時間：2017年6月1日，最新版本為3.2.0。 2.哪裡可以得到opencv的原始碼以及不同平臺的動態庫？ opencv的官方地址為http://opencv.org/，可以在這

IOS開發之OC學習筆記(中)

該筆記源自本人對一個網路視訊的學習如有侵權，請聯絡本人刪除。都是比較基礎的OC知識，中高階開發者可以忽略本文很多重要內容在程式碼註釋中 1. Foundation-結構體用法參考： NSRange rang

opencv學習筆記四十：背景消除建模

在很多情況下，我們需要從一段視訊中找到感興趣的目標，比如說當人進入已經打烊的超市時發出警報。為了達到這個目的，我們首先需要“學習”背景模型，然後將背景模型和當前影象進行比較，從而得到前景目標。背景建模（Background Subtraction）背景與前景都是

opencv學習筆記四十二：稠密光流跟蹤

利用Gunnar Farneback演算法計算全域性性的稠密光流演算法（即影象上所有畫素點的光流都計算出來），由於要計算影象上所有點的光流，故計算耗時，速度慢稠密光流需要使用某種插值方法在比較容易跟蹤的畫素之間進行插值以解決那些運動不明確的畫素 calcOpticalF

opencv學習筆記四十三：CamShift目標跟蹤

CamShift演算法，全稱是 Continuously AdaptiveMeanShift，顧名思義，它是對Mean Shift 演算法的改進，能夠自動調節搜尋視窗大小來適應目標的大小，可以跟蹤視訊中尺寸變化的目標。基本思想是以視訊影象中運動物體的顏色資訊作為特徵，對輸入影

opencv學習筆記四十四：移動物件統計

步驟：利用背景消除法找到移動的物體；預處理：進行中值濾波消除椒鹽噪聲，然後二值化再開操作；尋找輪廓；畫出輪廓最小矩形並統計。 #include<opencv2\opencv.hpp> using namespace cv; using namesp

opencv學習筆記四十九：基於距離變換和區域性自適應閾值的物件計數

案例背景：統計下圖中玉米粒的個數方案思路：先灰度化，再二值化（基於THRESH_TRIANGLE，圖中直方圖有明顯的雙峰值），腐蝕去掉一些小雜點，距離變換，再自適應區域性閾值，膨脹連成連通域，尋找輪廓進行計數。距離變換於1966年被學者首次提出,目前已被廣泛應

OpenCV學習筆記_0：開發環境配置

Win10 + Visual studio 2015 + OpenCV3.4.1 下載，安裝Visual studio 2015 下載，安裝OpenCV3.4.1 配置OpenCV

spring學習筆記四：spring常用註解總結

bean logs single 配置文件屬性註入 ring 如果 let ons 使用spring的註解，需要在配置文件中配置組件掃描器，用於在指定的包中掃描註解 <context:component-scan base-package="xxx.xxx.xxx

linux初級學習筆記四：Linux文件管理類命令詳解！(視頻序號：03_1)

單詞 linux初級 linux文件管理查看 stat 顯示行數 swd 字符處理行數本節學習的命令：cat(tac)，more，less，head，tail，cut，sort，uniq，wc，tr 本節學習的技能：目錄管理　　　　　　　　文件管理　　　　　　　　

OpenCV學習筆記3：圖像模糊作用和方法

希望 ont 去模糊 image title name 聽說但是意義一、意義和作用：圖像的模糊處理就是將圖片處理的更加模糊，如下圖，左側是原圖，右側是經過處理之後的圖片。從主觀意願上說，我們希望看到清晰的圖像，而不是模糊的圖像。所以很多時候我們聽說還有一種專門進

Docker學習筆記四：Docker容器(container)

fan .com lba docke file 域名學習 link uno 一：查看容器查看運行容器docker ps查看所有容器docker ps -a二：創建容器docker create <image> ##創建容器 docker start <

分散式學習筆記四：分散式鎖的實現方式

目前幾乎很多大型網站及應用都是分散式部署的，分散式場景中的資料一致性問題一直是一個比較重要的話題。分散式的CAP理論告訴我們“任何一個分散式系統都無法同時滿足一致性（Consistency）、可用性（Availability）和分割槽容錯性（Partition tolerance），最多隻能同時滿足

mapreduce學習筆記四：排序

code 表示特性 files writable arr pri 產生怎麽 1.Map端：（1）每個輸入分片會讓一個map任務來處理，默認情況下，以HDFS的一個塊的大小（默認為64M）為一個分片，當然我們也可以設置塊的大小。map輸出的結果會暫且放在一個環形內存緩

python爬蟲學習筆記四：BeautifulSoup庫對HTML文字進行操作

只要你提供的資訊是標籤，就可以很好的解析怎麼使用BeautifulSoup庫？ from bs4 import BeautifulSoup soup=BeautifulSoup('<p>data<p>','html.parser'）例如： import

Esper學習筆記四：EPL語法（2）

1.select 查詢所有屬性或特定屬性 EPL的select和SQL的select很相近，SQL用*表示查詢表的所有欄位，而EPL用*表示查詢事件流的所有屬性值。SQL查詢某個欄位名，直接在select後跟欄位名就ok，EPL也是將要查詢的屬性名放在select之後。若查多個屬

LTE學習筆記四：OFDM

OFDM是LTE物理層最基礎的技術。MIMO、頻寬自適應技術、動態資源排程技術都建立在OFDM技術之上得以實現。LTE標準體系最基礎、最複雜、最個性的地方是物理層。 1.OFDM 正交頻分複用技術，由多載波技術MCM（Multi-Carrier Modulation，多載

《C語言程式設計：現代方法（第2版）（K.N.King 著）》學習筆記四：C語言基本概念（3）

2.5 讀入輸入為了獲取輸入，就要用到 scanf 函式。它是C函式庫中與 printf 相對應的函式。scanf 中的字母 f 和 printf 中的字母 f 含義相同，都是表示“格式化”的意思

opencv學習筆記一：影象讀取與儲存

影象讀取函式：cv2.imread(影象路徑，標誌符) 影象路勁可以是絕對路徑和相對路徑；識別符號有三種： cv2.IMREAD_COLOR （忽視透明度）； cv2.IMREAD_GRAYSCALE（轉換成灰度影象讀取）； cv2.IMREAD_UNCHANGE

iOS開發之opencv學習筆記四：使用feature2d識別圖片

相關推薦