1. 程式人生 > >基於輪廓提取影象文字2---OpenCV-Python教程(11、輪廓檢測)

基於輪廓提取影象文字2---OpenCV-Python教程(11、輪廓檢測)

https://blog.csdn.net/sunny2038/article/details/12889059

相比C++而言,Python適合做原型。本系列的文章介紹如何在Python中用OpenCV圖形庫,以及與C++呼叫相應OpenCV函式的不同之處。這篇文章介紹在Python中使用OpenCV檢測並繪製輪廓。

提示:

  • 轉載請詳細註明原作者及出處,謝謝!
  • 本文介紹在OpenCV-Python中檢測並繪製輪廓的方法。
  • 本文不介詳細的理論知識,讀者可從其他資料中獲取相應的背景知識。筆者推薦清華大學出版社的《影象處理與計算機視覺演算法及應用(第2版) 》。

輪廓檢測

輪廓檢測也是影象處理中經常用到的。OpenCV-Python介面中使用cv2.findContours()函式來查詢檢測物體的輪廓。

實現

使用方式如下:

  1. import cv2  
  2. img = cv2.imread('D:\\test\\contour.jpg')  
  3. gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)  
  4. ret, binary = cv2.threshold(gray,127,255,cv2.THRESH_BINARY)  
  5. contours, hierarchy = cv2.findContours(binary,cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE)  
  6. cv2.drawContours(img,contours,-1,(0,0,255),3)  
  7. cv2.imshow("img", img)  
  8. cv2.waitKey(0)  

需要注意的是cv2.findContours()函式接受的引數為二值圖,即黑白的(不是灰度圖),所以讀取的影象要先轉成灰度的,再轉成二值圖,參見4、5兩行。第六行是檢測輪廓,第七行是繪製輪廓。

結果

原圖如下:

檢測結果如下:

注意,findcontours函式會“原地”修改輸入的影象。這一點可通過下面的語句驗證:

  1. cv2.imshow("binary", binary)  
  2. contours, hierarchy = cv2.findContours(binary,cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE)  
  3. cv2.imshow("binary2", binary)  
執行這些語句後會發現原圖被修改了。

cv2.findContours()函式

函式的原型為

  1. cv2.findContours(image, mode, method[, contours[, hierarchy[, offset ]]])  
返回兩個值:contours:hierarchy。

引數

第一個引數是尋找輪廓的影象;

第二個引數表示輪廓的檢索模式,有四種(本文介紹的都是新的cv2介面):
    cv2.RETR_EXTERNAL表示只檢測外輪廓
    cv2.RETR_LIST檢測的輪廓不建立等級關係
    cv2.RETR_CCOMP建立兩個等級的輪廓,上面的一層為外邊界,裡面的一層為內孔的邊界資訊。如果內孔內還有一個連通物體,這個物體的邊界也在頂層。
    cv2.RETR_TREE建立一個等級樹結構的輪廓。

第三個引數method為輪廓的近似辦法
    cv2.CHAIN_APPROX_NONE儲存所有的輪廓點,相鄰的兩個點的畫素位置差不超過1,即max(abs(x1-x2),abs(y2-y1))==1
    cv2.CHAIN_APPROX_SIMPLE壓縮水平方向,垂直方向,對角線方向的元素,只保留該方向的終點座標,例如一個矩形輪廓只需4個點來儲存輪廓資訊
    cv2.CHAIN_APPROX_TC89_L1,CV_CHAIN_APPROX_TC89_KCOS使用teh-Chinl chain 近似演算法

返回值

cv2.findContours()函式返回兩個值,一個是輪廓本身,還有一個是每條輪廓對應的屬性。

contour返回值

cv2.findContours()函式首先返回一個list,list中每個元素都是影象中的一個輪廓,用numpy中的ndarray表示。這個概念非常重要。在下面drawContours中會看見。通過
  1. print (type(contours))  
  2. print (type(contours[0]))  
  3. print (len(contours))  
可以驗證上述資訊。會看到本例中有兩條輪廓,一個是五角星的,一個是矩形的。每個輪廓是一個ndarray,每個ndarray是輪廓上的點的集合。

由於我們知道返回的輪廓有兩個,因此可通過

  1. cv2.drawContours(img,contours,0,(0,0,255),3)  
  1. cv2.drawContours(img,contours,1,(0,255,0),3)  
分別繪製兩個輪廓,關於該引數可參見下面一節的內容。同時通過
  1. print (len(contours[0]))  
  2. print (len(contours[1]))  
輸出兩個輪廓中儲存的點的個數,可以看到,第一個輪廓中只有4個元素,這是因為輪廓中並不是儲存輪廓上所有的點,而是隻儲存可以用直線描述輪廓的點的個數,比如一個“正立”的矩形,只需4個頂點就能描述輪廓了。

hierarchy返回值

此外,該函式還可返回一個可選的hiararchy結果,這是一個ndarray,其中的元素個數和輪廓個數相同,每個輪廓contours[i]對應4個hierarchy元素hierarchy[i][0] ~hierarchy[i][3],分別表示後一個輪廓、前一個輪廓、父輪廓、內嵌輪廓的索引編號,如果沒有對應項,則該值為負數。

通過

  1. print (type(hierarchy))  
  2. print (hierarchy.ndim)  
  3. print (hierarchy[0].ndim)  
  4. print (hierarchy.shape)  
得到
  1. 3
  2. 2
  3. (124)  
可以看出,hierarchy本身包含兩個ndarray,每個ndarray對應一個輪廓,每個輪廓有四個屬性。

輪廓的繪製

OpenCV中通過cv2.drawContours在影象上繪製輪廓。  

cv2.drawContours()函式

  1. cv2.drawContours(image, contours, contourIdx, color[, thickness[, lineType[, hierarchy[, maxLevel[, offset ]]]]])  
  • 第一個引數是指明在哪幅影象上繪製輪廓;
  • 第二個引數是輪廓本身,在Python中是一個list。
  • 第三個引數指定繪製輪廓list中的哪條輪廓,如果是-1,則繪製其中的所有輪廓。後面的引數很簡單。其中thickness表明輪廓線的寬度,如果是-1(cv2.FILLED),則為填充模式。繪製引數將在以後獨立詳細介紹。

補充:

寫著寫著發現一篇文章介紹不完,所以這裡先作為入門的。更多關於輪廓的資訊有機會再開一篇文章介紹。

但有朋友提出計算輪廓的極值點。可用下面的方式計算得到,如下

  1. pentagram = contours[1#第二條輪廓是五角星
  2. leftmost = tuple(pentagram[:,0][pentagram[:,:,0].argmin()])  
  3. rightmost = tuple(pentagram[:,0][pentagram[:,:,0].argmin()])  
  4. cv2.circle(img, leftmost, 2, (0,255,0),3)   
  5. cv2.circle(img, rightmost, 2, (0,0,255),3)   

注意!假設輪廓有100個點,OpenCV返回的ndarray的維數是(100, 1, 2)!!!而不是我們認為的(100, 2)。切記!!!人民郵電出版社出版了一本《NumPy攻略:Python科學計算與資料分析》,推薦去看一下。

更新:關於pentagram[:,0]的意思

在numpy的陣列中,用逗號分隔的是軸的索引。舉個例子,假設有如下的陣列:

  1. a = np.array([[[3,4]], [[1,2]],[[5,7]],[[3,7]],[[1,8]]])  
其shape是(5, 1, 2)。與我們的輪廓是相同的。那麼a[:,0]的結果就是:
  1. [3,4], [1,2], [5,7], [3,7], [1,8]  
這裡a[:,0]的意思就是a[0:5,0],也就是a[0:5,0:0:2],這三者是等價的

回頭看一下,a的shape是(5,1,2),表明是三個軸的。在numpy的陣列中,軸的索引是通過逗號分隔的。同時冒號索引“:”表示的是該軸的所有元素。因此a[:, 0]表示的是第一個軸的所有元素和第二個軸的第一個元素。在這裡既等價於a[0:5, 0]。

再者,若給出的索引數少於陣列中總索引數,則將已給出的索引樹預設按順序指派到軸上。比如a[0:5,0]只給出了兩個軸的索引,則第一個索引就是第一個軸的,第二個索引是第二個軸的,而第三個索引沒有,則預設為[:],即該軸的所有內容。因此a[0:5,0]也等價於a[0:5,0:0:2]。

再詳細一點,a的全體內容為:[[[3,4]], [[1,2]],[[5,7]],[[3,7]],[[1,8]]]。去掉第一層方括號,其中有五個元素,每個元素為[[3,4]]這樣的,所以第一個索引的範圍為[0:5]。注意OpenCV函式返回的多維陣列和常見的numpy陣列的不同之處!

觀察[[3,4]],我們發現其中只有一個元素,即[3, 4],第二個索引為[0:1]。

再去掉一層方括號,我們面對的是[3,4],有兩個元素,所以第三個索引的範圍為[0:2]。

再次強調一下OpenCVPython介面函式返回的NumPy陣列和普通的NumPy陣列在組織上的不同之處。

PS:OpenCV-Python討論群——219962286,歡迎大家加入互相探討學習。

得到的結果為如下:


參考資料:

1、《Opencv2 Computer Vision Application Programming Cookbook》

2、《OpenCV References Manule》

如果覺得本文寫的還可以的話,請輕點“頂”,您的支援是我寫下去的動力之一。未完待續。。。如有錯誤請指正,本人會虛心接受並改正!謝謝!