計算機視覺（二）：影象檢索以及基於影象描述符的搜尋

阿新 • • 發佈：2019-01-13

1 - 引言

在影象識別中，我們通常將圖片的特徵提取出來，並使用這些主要特徵來進行識別。
在OpenCV中提供了許多特徵檢測演算法，下面讓我們來學習一下怎麼使用這些演算法

2 - 特徵定義

粗略的講，特徵就是有意義的影象區域，該區域具有獨特性或易於識別性。因此，角點以及高密度區域是很好的特徵，而大量重複的模式或低密度區域則不是好的特徵。大多數特徵檢測演算法都會涉及影象的角點、變和斑點的識別。

2.1 - 檢測角點特徵

Opencv提供cornerHarris來識別角點

import cv2
import numpy as np

img = cv2.imread('images/7.jpg')
gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
gray = np.float32(gray)
dst = cv2.cornerHarris(gray,2,23,0.04)
"""
第二引數是標記號的大小。即引數值越小，標記角點的記號越小
最重要的是第三個引數，該引數限定了Sobel運算元的中孔，取值必須是介於3和31之間的奇數。
"""
img[dst>0.01*dst.max()] = [0,0,255]
while(True):
    cv2.imshow('corners',img)
    if cv2.waitKey(0):
        break

在這裡插入圖片描述

2.2 - 使用DoG和SIFT進行特徵提取與描述

DoG(Diffrerence of Gaussians)是對同一影象使用不同高斯濾波器所得到的結果
SIFT是尺度不變特徵變換（Scale-Invariant Feature Transform, SIFT），可以解決因影象比例而損失特徵的變換
（最新版本的OpenCV中SIFT函式已經被專利保護不能使用，需要安裝老版本才能使用，本文使用了3.4.2.16版本）

import cv2
import sys
import numpy as py

# 讀入影象
# imgpath=sys.argv[1]
imgpath = 'images/timg_1.jpg'
img = cv2.imread(imgpath)
# 更換顏色空間
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# 建立sift物件,計算灰度影象,會使用dog檢測角點
sift = cv2.xfeatures2d.SIFT_create()
keypoints, descriptor = sift.detectAndCompute(gray, None)

# print(keypoints)
# 關鍵點有以下幾個屬性
# angle 表示特徵的方向
# class_id 關鍵點的id
# octave 特徵所在金字塔的等級
# pt 影象中關鍵點的座標
# response 表示關鍵點的強度
# size 表示特徵的直徑
img = cv2.drawKeypoints(image=img,
 outImage=img,
 keypoints=keypoints,
 color=(51, 163, 236),
 flags=cv2.DRAW_MATCHES_FLAGS_DRAW_RICH_KEYPOINTS)

# 顯示影象
cv2.imshow('sift_keypoints', img)
while (True):
 if cv2.waitKey(int(1000 / 12)) & 0xFF == ord('q'):
    break
cv2.destroyAllWindows()

在這裡插入圖片描述

2.3 使用快速Hessian演算法和SURF來提取和檢測特徵

SURF特徵檢測演算法由Herbert Bay於2006年發表，該演算法比SIFT快好幾倍，它吸收了SIFT演算法的思想。（也被專利保護）

import cv2
import numpy as np

img = cv2.imread('images/timg_1.jpg')  # 讀取要處理的圖片
alg = input('Select an Alg --> ')


def fd(algorithm):
    if algorithm == 'SIFT':
        return cv2.xfeatures2d.SIFT_create()
    if algorithm == 'SURF':
        threshold = input('Enter a threshold --> ')  # 提示輸入SURF演算法所採用的閾值
        return cv2.xfeatures2d.SURF_create(float(threshold))


gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)  # 轉換為灰度影象
fd_alg = fd(alg)
keypoints, descriptor = fd_alg.detectAndCompute(gray, None)  # 進行演算法的檢測和計算

img = cv2.drawKeypoints(image=img, outImage=img, keypoints=keypoints,
                        flags=cv2.DRAW_MATCHES_FLAGS_DRAW_RICH_KEYPOINTS,
                        color=(51, 163, 236))
cv2.imshow('keypoints', img)
while (True):
    if cv2.waitKey(30) & 0xff == ord('q'):
        break
cv2.destroyAllWindows()

使用SURF演算法，並且閾值設為8000所得的結果，閾值越高提取的特徵也越少，我們可以修改閾值來達到最好的特徵提取效果
在這裡插入圖片描述

2.4 - 基於ORB的特徵檢測和特徵匹配

ORB處於起步階段，是用來替代SIFT和SURF的，與二者相比，ORB有更快的速度，在2011年才首次釋出，ORB基於FAST關鍵點檢測和BRIEF描述符的技術結合

FAST演算法
在畫素周圍繪製一個圓，該圓包括16個畫素，然後將每個畫素與加上一個閾值的圓心畫素進行比較，若有連續、比加上上一個閾值的圓心的畫素值還亮或者暗的畫素，則可認為圓心是角點。
BRIEF演算法
是一種關鍵點描述符，並找到他們的共同之處，是一種特徵匹配的演算法。
暴力匹配

下面先使用最簡單的暴力匹配來實現特徵匹配

import numpy as np
import cv2
from matplotlib import pyplot as plt

img1 = cv2.imread('images/LAKERS_LOGO.jpg',cv2.IMREAD_GRAYSCALE)#希望檢測出的特徵圖片
img2 = cv2.imread('images/LAKERS.jpg',cv2.IMREAD_GRAYSCALE)#測試圖片

orb = cv2.ORB_create()
"""
分別對查詢影象和訓練影象進行檢測，然後計算關鍵點和描述符
"""
kp1, des1 = orb.detectAndCompute(img1,None)
kp2, des2 = orb.detectAndCompute(img2,None)
bf = cv2.BFMatcher(cv2.NORM_HAMMING, crossCheck = True)
"""
使用暴力BFMatcher實現匹配
"""
matches = bf.match(des1,des2)
matches = sorted(matches, key= lambda x:x.distance)
img3 = cv2.drawMatches(img1,kp1,img2,kp2,matches[:40],img2,flags=2)
plt.imshow(img3),plt.show()

LOGO影象：
在這裡插入圖片描述

球場影象：
在這裡插入圖片描述

進行匹配後：
在這裡插入圖片描述

K-NN匹配

使用機器學習中的K-NN演算法來替代暴力匹配法
只需稍微修改上面的程式碼即可

matches = bf.knnMatch(des1,des2,k=2)
img3 = cv2.drawMatchesKnn(img1,kp1,img2,kp2,matches,img2,flags=2)

FLANN匹配

FLANN是最近鄰的快速庫，也就是說FLANN可以在庫中根據資料本身來選擇最適合的演算法進行匹配，經驗證，FLANN比其他的最近鄰搜尋軟體塊10倍

計算機視覺（二）：影象檢索以及基於影象描述符的搜尋

1 - 引言在影象識別中，我們通常將圖片的特徵提取出來，並使用這些主要特徵來進行識別。在OpenCV中提供了許多特徵檢測演算法，下面讓我們來學習一下怎麼使用這些演算法 2 - 特徵定義粗略的講，特徵就是有意義的影象區域，該區域具有獨特性或易於識別性。因此，角點以及高密度區域

計算機視覺（二）：直方圖均衡

一、灰度空間的直方圖均衡 1.直方圖 2.變換函式應滿足條件 3.變換函式 4.直方圖均衡二、彩色空間的直方圖均衡

計算機視覺（八）：影象分割

一、閾值處理 1. 基礎知識 2. 基本的全域性閾值處理 3. 用Otsu方法的全域性閾值處理 4. 用影象平滑改善全域性閾值處理 5. 利用邊

計算機視覺（三）：空間域濾波基礎

一、背景知識 1.空間域 2.運算元 3.變換函式二、一些基本的灰度變換函式 1.影象反轉

計算機視覺（一）：基礎篇

一、光和電磁波譜二、彩色模型 1.RGB彩色模型 2.HSV彩色模型 3.從RGB到HSV的彩色轉換 4.從HSV到RGB的彩色轉換

計算機視覺（七）：特徵檢測/提取（feature detection/extraction）

關鍵點檢測和匹配流水線四個階段一、背景知識 1. 影象特徵 2. 數字函式的一階導數和二階導數 3. 導數與影象特徵關係二

計算機視覺（六）：頻率域濾波器

一、濾波器 1. 基本濾波公式 2. 濾波步驟 3. 低通濾波器與高通濾波器二、低通濾波器（平滑影象）

計算機視覺（五）：頻率域濾波基礎

一、數學預備知識 1. 傅立葉級數二、基本概念 1. 頻率域 2. 複數 3. 尤拉公式

計算機視覺（四）：空間域濾波器

一、平滑空間濾波器 1. 平滑線性濾波器（均值濾波器） 2. 統計排序（平滑非線性）濾波器二、銳化空間濾波器

計算機視覺（二）

xtra roc 分類 match open 提取水平 histogram svm 濾波和邊緣檢測 1. 空間濾波和頻域濾波　　線性濾波和非線性濾波　　滑動濾波：　　blur 和 boxfilter、高斯濾波器是真正的低通濾波器、與boxfilter相比沒有振鈴現象

計算機視覺（八）：提取Cifar-10資料集的HOG、HSV特徵並使用神經網路進行分類

1 - 引言之前我們都是將整張圖片輸入進行分類，要想進一步提升準確率，我們就必須提取出圖片更容易區分的特徵，再將這些特徵當做特徵向量進行分類。在之前我們學了一些常用的影象特徵，在這次實驗中，我們使用了兩種特徵梯度方向直方圖（HOG）顏色直方圖（HSV）

計算機視覺（七）：構建兩層的神經網路來分類Cifar-10資料集

1 - 引言之前我們學習了神經網路的理論知識，現在我們要自己搭建一個結構為如下圖所示的神經網路，對Cifar-10資料集進行分類前向傳播比較簡單，就不在贅述反向傳播需要注意的是，softmax的反向傳播與之前寫的softmax程式碼一樣。神經網路內部的反向傳播權重偏導就是前面

計算機視覺（六）：使用Softmax分類Cifar-10資料集

1 - 引言這次，我們將使用Softmax來分類Cifar-10，過程其實很之前使用的SVM過程差不多，主要區別是在於損失函式的不同，而且Softmax分類器輸出的結果是輸入樣本在不同類別上的概率值大小,Softmax分類器也叫多項Logistic迴歸線性模型:

計算機視覺（五）：使用SVM分類Cifar-10資料集

1 - 引言之前我們使用了K-NN對Cifar-10資料集進行了圖片分類，正確率只有不到30%，但是還是比10%高的[手動滑稽]，這次我們將學習使用SVM分類器來對Cafi-10資料集實現分類，但是正確率應該也不會很高要想繼續提高正確率，就要對影象進行預處理和特徵的選取工作，而不

計算機視覺（四）：使用K-NN分類器對CIFAR-10進行分類

1 - 引言之前我們學習了KNN分類器的原理，現在讓我們將KNN分類器應用在計算機視覺中，學習如何使用這個演算法來進行圖片分類。 2 - 準備工作建立專案結構如圖所示在datasets檔案中下載資料集Cifar-10 k_nearest_neighbo

計算機視覺（三）：目標檢測與識別

1 - 引言目標檢測和識別，是計算機視覺最常見的挑戰之一。目標檢測和識別的區別在於：目標檢測是用來確定影象的某個區域是否含有要識別的物件，而識別是程式識別物件的能力。識別通常只處理已檢測到物件的區域。在計算機視覺中有很多目標檢測和識別的技術梯度直方圖（Hist

計算機視覺（一）：人臉檢測和識別

1 - 引言之前我們學習了機器學習和數字影象處理的相關知識，瞭解了基本的概念理論和OpenCV和TensorFlow框架的使用，現在我們可以結合這些知識與工具寫出屬於我們自己的計算機視覺專案，本文主要介紹瞭如何使用OpenCV提供的函式來構建一個人臉識別和檢測的應用 2 - Haa

計算機視覺（二）-opencv之createTrackbar()詳解

摘要：我學習openCV3看的是《學習openCV3》這本書，很厚的一本，不知道是不是因為自己看的還不是很多，個人覺得裡面的有些重要函式講的不是很詳細，比如createTrackbar()這個函式，這個函數出現在這本書的第三個例項程式，書中只是說明了這是一個建立滾動條的程式，然而對裡面的引數講解以及與他相

JavaScript OOP（二）：this關鍵字以及call、apply、bind

col als == ole 構造 prototype logs rip .com JavaScript的this關鍵字非常靈活！ this 返回的總是對象；即返回屬性或方法“當前”所在的對象 1 var o1={ 2 name:‘apple‘, 3

dubbo原始碼分析（二）：超時原理以及應用場景

本篇主要記錄dubbo中關於超時的常見問題，實現原理，解決的問題以及如何在服務降級中體現作用等。超時問題為了檢查對dubbo超時的理解，嘗試回答如下幾個問題，如果回答不上來或者不確定那麼說明此處需要再多研究研究。我只是針對個人的理解提問題，並不代表我理解的就是全面深入的，但我的問題如果也回答不

計算機視覺（二）：影象檢索以及基於影象描述符的搜尋

1 - 引言

2 - 特徵定義

2.1 - 檢測角點特徵

2.2 - 使用DoG和SIFT進行特徵提取與描述

2.3 使用快速Hessian演算法和SURF來提取和檢測特徵

2.4 - 基於ORB的特徵檢測和特徵匹配

相關推薦