1. 程式人生 > >opencv-python 的Camshift函式(附逐行詳解)

opencv-python 的Camshift函式(附逐行詳解)

這是我在OpenCV-python教程中找到的程式碼並附上的詳解


import cv2
import numpy as np

cap = cv2.VideoCapture(0)

# ret判斷是否讀到圖片
# frame讀取到的當前幀的矩陣
# 返回的是元組型別,所以也可以加括號
ret, frame = cap.read()
# print(type(ret), ret)
# print(type(frame), frame)


# 設定跟蹤框引數
r,h,c,w = 250,90,400,125  # simply hardcoded the values
track_window = (c,r,w,h)

# 從當前幀中框出一個小框
roi = frame[r:r+h, c:c+w]
# RGB轉為HSV更好處理
hsv_roi =  cv2.cvtColor(frame, cv2.COLOR_BGR2HSV)

# inRange函式設定亮度閾值
# 去除低亮度的畫素點的影響
# eg. mask = cv2.inRange(hsv, lower_red, upper_red)

# 將低於和高於閾值的值設為0
mask = cv2.inRange(hsv_roi, np.array((0., 60.,32.)), np.array((180.,255.,255.)))

# 然後得到框中影象的直方圖
# cv2.calcHist(images, channels, mask, histSize, ranges[, hist[, accumulate ]])
# mask 即上文的閾值設定
# histSize表示這個直方圖分成多少份(即多少個直方柱)
# range是表示直方圖能表示畫素值的範圍
# 返回直方圖
roi_hist = cv2.calcHist([hsv_roi],[0],mask,[180],[0,180])

# 歸一化函式cv2.normalize(src[, dst[, alpha[, beta[, norm_type[, dtype[, mask]]]]]])
# 返回dst型別
# 歸一化就是要把需要處理的資料經過處理後(通過某種演算法)限制在你需要的一定範圍內
# src  - 輸入陣列
# dst  - 與src大小相同的輸出陣列
# alpha  - 範圍值,   以便在範圍歸一化的情況下歸一化到較低範圍邊界
# beta  - 範圍歸一化時的上限範圍; 它不用於標準規範化
# normType  - 規範化型別 這裡的NORM_MINMAX是陣列的數值被平移或縮放到一個指定的範圍,線性歸一化。
# dtype  - 當為負數時,輸出陣列與src的型別相同;否則,它具有與src相同的通道數;深度=CV_MAT_DEPTH(dtype)
# mask  - 可選的操作掩碼。
cv2.normalize(roi_hist,roi_hist,0,255,cv2.NORM_MINMAX)

# 設定迭代的終止標準,最多十次迭代
term_crit = ( cv2.TERM_CRITERIA_EPS | cv2.TERM_CRITERIA_COUNT, 10, 1 )

while(1):
    ret ,frame = cap.read()

    if ret == True:
        hsv = cv2.cvtColor(frame, cv2.COLOR_BGR2HSV)

        # 反向投影函式(特徵提取函式)
        # 反向投影是一種記錄給定影象中的畫素點如何適應直方圖模型畫素分佈的方式
        # 反向投影就是首先計算某一特徵的直方圖模型,然後使用模型去尋找影象中存在的特徵
        # cv2.calcHist(images, channels, mask, histSize, ranges[, hist[, accumulate]])

        # images:待處理的影象,影象格式為uint8或float32
        # channels:對應影象需要統計的通道,若是灰度圖則為0,彩色影象B、G、R對應0、1、2
        # mask:掩膜影象。如果統計整幅影象就設定為None,否則這裡傳入設計的掩膜影象。
        # histSize表示這個直方圖分成多少份(即多少個直方柱)
        # ranges:畫素量化範圍,通常為0 - 255。
        dst = cv2.calcBackProject([hsv],[0],roi_hist,[0,180],1)

        # RotatedRect CamShift(InputArray probImage, Rect&window, TermCriteria criteria)。
        # probImage為輸入影象直方圖的反向投影圖,
        # window為要跟蹤目標的初始位置矩形框,
        # criteria為演算法結束條件。
        # 函式返回一個有方向角度的矩陣。
        #
        ret, track_window = cv2.CamShift(dst, track_window, term_crit)

        # Draw it on image
        pts = cv2.boxPoints(ret)

        # 型別轉換int0()用於索引的整數(same as C ssize_t; normally either int32 or int64)
        pts = np.int0(pts)

        # 非填充多邊形:polylines()
        # cv2.polylines(img, pts, isClosed, color[, thickness[, lineType[, shift]]])
        # img – 要畫的圖片
        # pts – 多邊形的頂點
        # isClosed – 是否閉合線段
        # color – 顏色
        img2 = cv2.polylines(frame,[pts],True, 255,2)
        
        cv2.imshow('img2',img2)

        # 停止追蹤按鈕
        k = cv2.waitKey(60) & 0xff
        if k == 27:
            break
        else:
            cv2.imwrite(chr(k)+".jpg",img2)

    else:
        break

cv2.destroyAllWindows()
cap.release()