Python+OpenCV影象處理(九)—— 模板匹配
百度百科:模板匹配是一種最原始、最基本的模式識別方法,研究某一特定物件物的圖案位於影象的什麼地方,進而識別物件物,這就是一個匹配問題。它是影象處理中最基本、最常用的匹配方法。模板匹配具有自身的侷限性,主要表現在它只能進行平行移動,若原影象中的匹配目標發生旋轉或大小變化,該演算法無效。
簡單來說,模板匹配就是在整個影象區域發現與給定子影象匹配的小塊區域。
工作原理:在帶檢測影象上,從左到右,從上向下計算模板影象與重疊子影象的匹配度,匹配程度越大,兩者相同的可能性越大。
程式碼如下:
#模板匹配 import cv2 as cv import numpy as np def template_demo(): tpl =cv.imread("E:/imageload/sample1.jpg") target = cv.imread("E:/imageload/target1.jpg") cv.namedWindow('template image', cv.WINDOW_NORMAL) cv.imshow("template image", tpl) cv.namedWindow('target image', cv.WINDOW_NORMAL) cv.imshow("target image", target) methods = [cv.TM_SQDIFF_NORMED, cv.TM_CCORR_NORMED, cv.TM_CCOEFF_NORMED] #3種模板匹配方法 th, tw = tpl.shape[:2] for md in methods: print(md) result = cv.matchTemplate(target, tpl, md) min_val, max_val, min_loc, max_loc = cv.minMaxLoc(result) if md == cv.TM_SQDIFF_NORMED: tl = min_loc else: tl = max_loc br = (tl[0]+tw, tl[1]+th) #br是矩形右下角的點的座標 cv.rectangle(target, tl, br, (0, 0, 255), 2) cv.namedWindow("match-" + np.str(md), cv.WINDOW_NORMAL) cv.imshow("match-" + np.str(md), target) template_demo() cv.waitKey(0) cv.destroyAllWindows()
執行結果:
注意:
1.幾種常見的模板匹配演算法:
其中,
①TM_SQDIFF是平方差匹配;TM_SQDIFF_NORMED是標準平方差匹配。利用平方差來進行匹配,最好匹配為0.匹配越差,匹配值越大。
②TM_CCORR是相關性匹配;TM_CCORR_NORMED是標準相關性匹配。採用模板和影象間的乘法操作,數越大表示匹配程度較高, 0表示最壞的匹配效果。
③TM_CCOEFF是相關性係數匹配;TM_CCOEFF_NORMED是標準相關性係數匹配。將模版對其均值的相對值與影象對其均值的相關值進行匹配,1表示完美匹配,-1表示糟糕的匹配,0表示沒有任何相關性(隨機序列)。
總結:隨著從簡單的測量(平方差)到更復雜的測量(相關係數),我們可獲得越來越準確的匹配(同時也意味著越來越大的計算代價)。
參考:
補:個人認為參考的第一篇部落格的關於模板匹配演算法的原理有一點點點錯誤,模板影象應該是左上角開始,而不是從中心點開始。在左上角那個點開始計算匹配度,最後得出的最匹配的座標點是模板影象左上角的位置(純屬個人覺得,如有錯誤,歡迎指出來)。
我認為模板匹配原理應該如下:
2.opencv的目標匹配函式為matchTemplate,函式原型為:matchTemplate(image, templ, method[, result[, mask]]) -> result
image引數表示待搜尋源影象,必須是8位整數或32位浮點。
templ引數表示模板影象,必須不大於源影象並具有相同的資料型別。
method引數表示計算匹配程度的方法。
result引數表示匹配結果影象,必須是單通道32位浮點。如果image的尺寸為W x H,templ的尺寸為w x h,則result的尺寸為(W-w+1)x(H-h+1)。
3.opencv的函式minMaxLoc:在給定的矩陣中尋找最大和最小值,並給出它們的位置。 該功能不適用於多通道陣列。 如果您需要在所有通道中查詢最小或最大元素,要先將陣列重新解釋為單通道。
函式minMaxLoc原型為:minMaxLoc(src[, mask]) -> minVal, maxVal, minLoc, maxLoc
src引數表示輸入單通道影象。
mask引數表示用於選擇子陣列的可選掩碼。
minVal引數表示返回的最小值,如果不需要,則使用NULL。
maxVal引數表示返回的最大值,如果不需要,則使用NULL。
minLoc引數表示返回的最小位置的指標(在2D情況下); 如果不需要,則使用NULL。
maxLoc引數表示返回的最大位置的指標(在2D情況下); 如果不需要,則使用NULL。
4.opencv的函式rectangle用於繪製矩形。函式原型為: rectangle(img, pt1, pt2, color[, thickness[, lineType[, shift]]]) -> img
img引數表示源影象。
pt1引數表示矩形的一個頂點。
pt2引數表示與pt1相對的對角線上的另一個頂點 。
color引數表示矩形線條顏色 (RGB) 或亮度(灰度影象 )。
thickness引數表示組成矩形的線條的粗細程度。取負值時(如 CV_FILLED)函式繪製填充了色彩的矩形。
lineType引數表示線條的型別。
shift引數表示座標點的小數點位數。