1. 程式人生 > >用 Python 和 OpenCV 檢測圖片上的條形碼(轉載)

用 Python 和 OpenCV 檢測圖片上的條形碼(轉載)

 

原文地址:http://python.jobbole.com/80448/

假設我們要檢測下圖中的條形碼:

圖1:包含條形碼的示例圖片

現在讓我們開始寫點程式碼,新建一個檔案,命名為detect_barcode.py,開啟並編碼:

Python

1 # import the necessary packages
2 import numpy as np
3 import argparse
4 import cv2
5
6 # construct the argument parse and parse the arguments
7

 ap = argparse.ArgumentParser()
8 ap.add_argument("-i""--image", required = True, help = "path to the image file")
9 args = vars(ap.parse_args())

我們首先做的是匯入所需的軟體包,我們將使用NumPy做數值計算,argparse用來解析命令列引數,cv2是OpenCV的繫結。

然後我們設定命令列引數,我們這裡需要一個簡單的選擇,–image是指包含條形碼的待檢測影象檔案的路徑。

現在開始真正的影象處理:

Python

1

2

3

4

5

6

7

8

9

10

11

12

11 # load the image and convert it to grayscale

12 image = cv2.imread(args["image"])

13 gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

14

15 # compute the Scharr gradient magnitude representation of the images

16 # in both the x and y direction

17 gradX = cv2.Sobel(gray, ddepth = cv2.cv.CV_32F, dx = 1, dy = 0, ksize = -1)

18 gradY = cv2.Sobel(gray, ddepth = cv2.cv.CV_32F, dx = 0, dy = 1, ksize = -1)

19

20 # subtract the y-gradient from the x-gradient

21 gradient = cv2.subtract(gradX, gradY)

22 gradient = cv2.convertScaleAbs(gradient)

12~13行:從磁碟載入影象並轉換為灰度圖。

17~18行:使用Scharr操作(指定使用ksize = -1)構造灰度圖在水平和豎直方向上的梯度幅值表示。

21~22行:Scharr操作之後,我們從x-gradient中減去y-gradient,通過這一步減法操作,最終得到包含高水平梯度和低豎直梯度的影象區域。

上面的gradient表示的原始影象看起來是這樣的:

圖:2:條形碼影象的梯度表示

注意條形碼區域是怎樣通過梯度操作檢測出來的。下一步將通過去噪僅關注條形碼區域。

Python

1

2

3

24 # blur and threshold the image

25 blurred = cv2.blur(gradient, (9, 9))

26 (_, thresh) = cv2.threshold(blurred, 225, 255, cv2.THRESH_BINARY)

25行:我們要做的第一件事是使用9*9的核心對梯度圖進行平均模糊,這將有助於平滑梯度表徵的圖形中的高頻噪聲。

26行:然後我們將模糊化後的圖形進行二值化,梯度圖中任何小於等於255的畫素設為0(黑色),其餘設為255(白色)。

模糊並二值化後的輸出看起來是這個樣子:

圖3:二值化梯度圖以此獲得長方形條形碼區域的粗略近似

然而,如你所見,在上面的二值化影象中,條形碼的豎槓之間存在縫隙,為了消除這些縫隙,並使我們的演算法更容易檢測到條形碼中的“斑點”狀區域,我們需要進行一些基本的形態學操作:

Python

1

2

3

28 # construct a closing kernel and apply it to the thresholded image

29 kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (21, 7))

30 closed = cv2.morphologyEx(thresh, cv2.MORPH_CLOSE, kernel)

29行:我們首先使用cv2.getStructuringElement構造一個長方形核心。這個核心的寬度大於長度,因此我們可以消除條形碼中垂直條之間的縫隙。

30行:這裡進行形態學操作,將上一步得到的核心應用到我們的二值圖中,以此來消除豎槓間的縫隙。

現在,你可以看到這些縫隙相比上面的二值化影象基本已經消除:

圖4:使用形態學中的閉運算消除條形碼豎條之間的縫隙

當然,現在影象中還有一些小斑點,不屬於真正條形碼的一部分,但是可能影響我們的輪廓檢測。

讓我們來消除這些小斑點:

Python

1

2

3

32 # perform a series of erosions and dilations

33 closed = cv2.erode(closed, None, iterations = 4)

34 closed = cv2.dilate(closed, None, iterations = 4)

我們這裡所做的是首先進行4次腐蝕(erosion),然後進行4次膨脹(dilation)。腐蝕操作將會腐蝕影象中白色畫素,以此來消除小斑點,而膨脹操作將使剩餘的白色畫素擴張並重新增長回去。

如果小斑點在腐蝕操作中被移除,那麼在膨脹操作中就不會再出現。

經過我們這一系列的腐蝕和膨脹操作,可以看到我們已經成功地移除小斑點並得到條形碼區域。

圖5:應用一系列的腐蝕和膨脹來移除不相關的小斑點

最後,讓我們找到影象中條形碼的輪廓:

Python

36 # find the contours in the thresholded image, then sort the contours
37 # by their area, keeping only the largest one
38 (cnts, _) = cv2.findContours(closed.copy(), cv2.RETR_EXTERNAL,
39    cv2.CHAIN_APPROX_SIMPLE)
40 c = sorted(cnts, key = cv2.contourArea, reverse = True)[0]
41
42 # compute the rotated bounding box of the largest contour
43 rect = cv2.minAreaRect(c)
44 box = np.int0(cv2.cv.BoxPoints(rect))
45
46 # draw a bounding box arounded the detected barcode and display the
47 # image
48 cv2.drawContours(image, [box], -1, (02550), 3)
49 cv2.imshow("Image", image)
50 cv2.waitKey(0)

38~40行:幸運的是這一部分比較容易,我們簡單地找到影象中的最大輪廓,如果我們正確完成了影象處理步驟,這裡應該對應於條形碼區域。

43~44行:然後我們為最大輪廓確定最小邊框

48~50行:最後顯示檢測到的條形碼

正如你在下面的圖片中所見,我們已經成功檢測到了條形碼:

圖6:成功檢測到示例影象中的條形碼

下一部分,我們將嘗試更多影象。

成功的條形碼檢測

要跟隨這些結果,請使用文章下面的表單去下載本文的原始碼以及隨帶的圖片。

一旦有了程式碼和影象,開啟一個終端來執行下面的命令:

Python

1

$ python detect_barcode.py --image images/barcode_02.jpg

圖7:使用OpenCV檢測影象中的一個條形碼

檢測椰油瓶子上的條形碼沒有問題。

讓我們試下另外一張圖片:

Python

1

$ python detect_barcode.py --image images/barcode_03.jpg

圖8:使用計算機視覺檢測影象中的一個條形碼

我們同樣能夠在上面的圖片中找到條形碼。

關於食品的條形碼檢測已經足夠了,書本上的條形碼怎麼樣呢:

Python

1

$ python detect_barcode.py --image images/barcode_04.jpg

圖9:使用Python和OpenCV檢測書本上的條形碼

沒問題,再次通過。

那包裹上的跟蹤碼呢?

Python

1

$ python detect_barcode.py --image images/barcode_05.jpg

圖10:使用計算機視覺和影象處理檢測包裹上的條形碼

我們的演算法再次成功檢測到條形碼。

最後,我們再嘗試一張圖片,這個是我最愛的義大利麵醬—饒氏自制伏特加醬(Rao’s Homemade Vodka Sauce):

Python

1

$ python detect_barcode.py --image images/barcode_06.jpg

圖11:使用Python和Opencv很容易檢測條形碼

我們的演算法又一次檢測到條形碼!

總結

這篇博文中,我們回顧了使用計算機視覺技術檢測影象中條形碼的必要步驟,使用Python程式語言和OpenCV庫實現了我們的演算法。

演算法概要如下:

  1. 計算x方向和y方向上的Scharr梯度幅值表示
  2. 將x-gradient減去y-gradient來顯示條形碼區域
  3. 模糊並二值化影象
  4. 對二值化影象應用閉運算核心
  5. 進行系列的腐蝕、膨脹
  6. 找到影象中的最大輪廓,大概便是條形碼

需要注意的是,該方法做了關於影象梯度表示的假設,因此只對水平條形碼有效。

如果你想實現一個更加魯棒的條形碼檢測演算法,你需要考慮影象的方向,或者更好的,應用機器學習技術如Haar級聯或者HOG + Linear SVM去掃描影象條形碼區域。