1. 程式人生 > >python+openCV呼叫攝像頭拍攝和處理圖片

python+openCV呼叫攝像頭拍攝和處理圖片

在深度學習過程中想做手勢識別相關應用,需要大量採集手勢圖片進行訓練,作為一個懶人當然希望飛快的連續採集圖片並且採集到的圖片就已經被處理成統一格式的啦。。於是使用python+openCV呼叫攝像頭,在採集圖片的同時順便處理成想要的格式。

詳細程式碼如下:

import cv2
import os

print("=============================================")
print("=  熱鍵(請在攝像頭的視窗使用):             =")
print("=  z: 更改儲存目錄                          =")
print
("= x: 拍攝圖片 =") print("= q: 退出 =") print("=============================================") print() class_name = input("請輸入儲存目錄:") while os.path.exists(class_name): class_name = input("目錄已存在!請輸入儲存目錄:") os.mkdir(class_name) index = 1 cap =
cv2.VideoCapture(0) width = 640 height = 480 w = 360 cap.set(cv2.CAP_PROP_FRAME_WIDTH, width) cap.set(cv2.CAP_PROP_FRAME_HEIGHT, height) crop_w_start = (width-w)//2 crop_h_start = (height-w)//2 print(width, height) while True: # get a frame ret, frame = cap.read() # show a frame frame = frame[
crop_h_start:crop_h_start+w, crop_w_start:crop_w_start+w] frame = cv2.flip(frame,1,dst=None) cv2.imshow("capture", frame) input = cv2.waitKey(1) & 0xFF if input == ord('z'): class_name = input("請輸入儲存目錄:") while os.path.exists(class_name): class_name = input("目錄已存在!請輸入儲存目錄:") os.mkdir(class_name) elif input == ord('x'): cv2.imwrite("%s/%d.jpeg" % (class_name, index), cv2.resize(frame, (224, 224), interpolation=cv2.INTER_AREA)) print("%s: %d 張圖片" % (class_name, index)) index += 1 if input == ord('q'): break cap.release() cv2.destroyAllWindows()

要點記錄:

  1. 當前版本opencv-python(3.4.3.18)中攝像頭有關屬性為cv2.XXXX,其獲取和設定函式分別如下:(以幀的寬和高為例)
# 獲取
width = int(videoCapture.get(cv2.CV_CAP_PROP_FRAME_WIDTH)
height = int(videoCapture.get(cv2.CV_CAP_PROP_FRAME_HEIGHT)
# 設定
cv2.VideoCapture(0).set(cv2.CAP_PROP_FRAME_WIDTH, width)
cv2.VideoCapture(0).set(cv2.CAP_PROP_FRAME_HEIGHT, height)
  1. 幀寬和高預設為640x480(這是視窗的大小),畫面比例為顯示器解析度,例如我的顯示器解析度為1920x1080,則攝像頭畫面以640x360的大小顯示在視窗中央,並用黑邊填充上下部分,攝像頭畫面長寬比似乎無法被改變
  2. read得到的幀(frame )可以視為普通的影象來處理,本質上這個程式就是不斷read一張圖片並顯示在視窗上,因此可以使用opencv有關影象處理的各種函式對frame進行操作並顯示,我這裡就是使用這個原理裁剪frame,使攝像頭畫面顯示成正方形
  3. 前置攝像頭獲取的畫面是非鏡面的,即左手會出現在畫面的右側,此處使用flip進行水平映象處理