python3深度學習：計算機視覺OpenCV擴大影象資料庫

阿新 • • 發佈：2019-01-14

OpenCV擴大影象資料庫

由於無論使用何種演算法和框架對神經網路進行訓練，圖片的資料量始終是一個決定訓練模型好壞的重要前提。資料擴充套件是訓練模型的一個常用手段，對於模型的魯棒性以及準確率都有非常重要的幫助。

1 影象的隨機裁剪

圖片的隨機裁剪是一個常用的擴大影象資料庫的手段，好處是對於大多數的圖片資料，進行模型之前都需變成統一的大小。雖圖片的大小相同，但不同的裁剪位置卻能夠提供更多的資料樣本，從而提高基本的圖片資料的內容。

import cv2
import numpy as np
import random
import matplotlib.pyplot as plt


img = cv2.imread("leaf.png")
width, height, depth = img.shape

img_width_box = width * 0.7
img_heigth_box = height * 0.7

# 擷取的圖片個數
for _ in range(10):
    # 均勻分佈隨機數
    start_pointX = np.int(random.uniform(0, img_width_box))
    start_pointY = np.int(random.uniform(0, img_heigth_box))
    copyImg = img[start_pointX:300, start_pointY:300]
    copyImg = cv2.resize(copyImg, (100, 100))
    cv2.imwrite("pic/"+"2_"+str(_)+".jpg", copyImg)

2 影象的隨機旋轉變換

相對於影象的旋轉、平移和翻轉(wrapAffine(): 仿射變換)，影象的隨機旋轉變換並不會使得圖片變形。

cv2.getRotationMatrix2D(center, angle, scale): 計算2D旋轉的仿射矩陣

引數:

center: 旋轉的中心

angle: 旋轉的角度

scale: 縮放的倍數

【問題：黑邊的去除（未完成）】

import cv2
import numpy as np
from scipy import ndimage


img = cv2.imread("leaf.png")
width, height, depth = img.shape

# 計算仿射矩陣
img_change = cv2.getRotationMatrix2D((width/2, height/2), 45, 1)
# 仿射變換
res = cv2.warpAffine(img, img_change, (width, height))

cv2.imshow("res", res)
cv2.waitKey()

3 影象色彩的隨機變換

import cv2
import numpy as np
import random


img = cv2.imread("leaf.png")
img_hsv = cv2.cvtColor(img, cv2.COLOR_BGR2HSV)

# 產生10張圖片
for i in range(10):
    
    # H範圍：[0, 180]
    # S範圍：[0, 255]
    # V範圍：[0, 255]
    turn_green_hsv = img_hsv.copy()
    turn_green_hsv[:, :, 0] = (turn_green_hsv[:, :, 0] + np.random.randint(1, 180)) % 180
    turn_green_hsv[:, :, 1] = (turn_green_hsv[:, :, 1] + np.random.randint(1, 255)) % 255
    turn_green_hsv[:, :, 2] = (turn_green_hsv[:, :, 2] + np.random.randint(1, 255)) % 255
    turn_green_img = cv2.cvtColor(turn_green_hsv, cv2.COLOR_HSV2BGR)
    turn_green_img = cv2.resize(turn_green_img, (100, 100))
    cv2.imwrite("pic/"+"12_"+str(i)+".jpg", turn_green_img)

4 對滑鼠的監控

使用滑鼠在生成的圖片上標記出目標位置是基本的資料處理內容。滑鼠操作輸入使用者介面操作，OpenCV同樣提供了對滑鼠操作的函式，這一部分功能主要由mouse_event完成。mouse_event的功能是監控滑鼠的操作，對滑鼠的點選、移動、放開等作出反應，根據不同的操作進行處理。

事件共如下12種：

EVENT_LBUTTONDBLCLK = 7 # 左鍵雙擊

EVENT_LBUTTONDOWN = 1 # 左鍵單擊

EVENT_LBUTTONUP = 4 # 左鍵釋放

EVENT_MBUTTONDBLCLK = 9 # 中間雙擊

EVENT_MBUTTONDOWN = 3 # 中間點選

EVENT_MBUTTONUP = 6 # 中間釋放

EVENT_MOUSEHWHEEL = 11 # 滑鼠滾輪釋放

EVENT_MOUSEMOVE = 0 # 滑鼠移動

EVENT_MOUSEWHEEL = 10 # 滑鼠滾輪

EVENT_RBUTTONDBLCLK = 8 # 右鍵雙擊

EVENT_RBUTTONDOWN = 2 # 右鍵點選

EVENT_RBUTTONUP = 5 # 右鍵釋放

import cv2
import numpy as np


# 標誌位：判斷滑鼠是否按下
drawing = False
ix, iy = -1, -1
rect_start = (0, 0)

# 建立回撥函式
def on_mouse(event, x, y, flags, param):
    global drawing
    global ix, iy
    global rect_start

    # 當按下左鍵：返回起始座標位置
    if event == cv2.EVENT_LBUTTONDOWN:
        drawing = True
        # ix, iy = x, y
        rect_start = (x, y)

    # 滑鼠左鍵按下並移動：繪製圖形
    # event: 判斷滑鼠是否移動
    # flags: 判斷是否是左鍵按下
    elif event == cv2.EVENT_MOUSEMOVE and flags == cv2.EVENT_FLAG_LBUTTON:
        if drawing == True:

            # rectangle: (img, pt1, pt2, color, thickness=None, lineType=None, shift=None)
            # img: image
            # pt1: start point
            # pt2: end point
            # color: 三原色
            # thickness: 構成矩陣的線條的粗細
            # lineType: 線條型別
            # shift: 點座標中小數的位數
            cv2.rectangle(img, rect_start, (x, y), (0, 0, 0), -1)
        elif event == cv2.EVENT_LBUTTONUP:
            drawing = False


# 建立影象與視窗，並將視窗與回撥函式繫結
img = cv2.imread("leaf.png")
cv2.namedWindow("image")
cv2.setMouseCallback("image", on_mouse)


while True:
    cv2.imshow("image", img)
    if cv2.waitKey(1) & 0xFF == ord("q"):
        break
cv2.destroyAllWindows()

python3深度學習：計算機視覺OpenCV擴大影象資料庫

OpenCV擴大影象資料庫由於無論使用何種演算法和框架對神經網路進行訓練，圖片的資料量始終是一個決定訓練模型好壞的重要前提。資料擴充套件是訓練模型的一個常用手段，對於模型的魯棒性以及準確率都有非常重要的幫助。 1 影象的隨機裁剪圖片的隨機裁剪是一個常用的擴大

python3深度學習：計算機視覺OpenCV的安裝及使用(旋轉後圖像黑邊的去除未完成)

1.OpenCV庫的安裝與使用 OpenCV全稱為Open Source Computer Vision Library，是Intel公司支援開發的計算機視覺處理開源軟體庫，採用C或C++編寫，同樣提供了Python、MATLAB等語言的介面，可以自由的與醒來linux、Window

python3深度學習：計算機視覺仿射變換

1.模型變換的基本形式模型變換是指根據待匹配影象與背景影象之間幾何畸變的情況，所選擇的能最佳擬合兩幅影象之間變化的幾何變換模型。可採用的變換模型有如下幾種:剛性變換、仿射變換、透視變換和非線形變換等，如下圖： 2.仿射變換仿射變換（Affine Tr

python3深度學習：計算機視覺Gamma變換

【參考資料】https://blog.csdn.net/lichengyu/article/details/8457425 &n

從特徵描述子到深度學習：計算機視覺的20年曆程 From feature descriptors to deep learning: 20 years of computer vision

We all know that deep convolutional neural networks have produced some stellar results on object detection and recognition benchmarks in the past two year

深度學習與計算機視覺：搞懂反向傳播演算法的四個基本方程

BP演算法，在深度神經網路的發展中有著舉足輕重的地位，對於反向傳播演算法的推導過程，各種資料介紹可謂是多不勝數。但，由於深度神經網路的複雜性，要比較深刻的理解反向傳播演算法還是需要自己手動的推導一遍。本文以前篇深度學習與計算機視覺：深度學習必知基本概念以及鏈式求導介紹了神經網路的反向傳播中的鏈式求導法則

深度學習與計算機視覺：深度學習必知基本概念以及鏈式求導

深度學習與計算機視覺，開篇。深度學習的幾個基本概念反向傳播演算法中的鏈式求導法則。關於反向傳播四個基本方程的推導過程，放在下一篇。深度學習基礎深度學習的幾度沉浮的歷史就不多說了，這裡梳理下深度學習的一些基本概念，做個總結記錄，內容多來源於網路。神

學習計算機視覺：（三）深度學習在計算機視覺中的應用

1.影象分類：卷積神經網路CNN 影象分類概念首先，影象分類是解決是什麼的問題？如下圖，給定一幅圖片，網路能夠給出“最像”什麼的概率：影象分類使用的技術 •卷積神經網路CNN 它是

深度學習與計算機視覺[CS231N] 學習筆記（4.1）：反向傳播（Backpropagation）

在學習深度學習的過程中，我們常用的一種優化引數的方法就是梯度下降法，而一般情況下，我們搭建的神經網路的結構是：輸入→權重矩陣→損失函式。如下圖所示。而在給定輸入的情況下，為了使我們的損失函式值達到最小，我們就需要調節權重矩陣，使之滿足條件，於是，就有了本

【逐夢AI】深度學習與計算機視覺應用實戰課程（BAT工程師主講，無人汽車，機器人，神經網絡）

bat 神經網絡深度學習深度學習框架 0基礎 http 提取框架以及【逐夢AI】深度學習與計算機視覺應用實戰課程（BAT工程師主講，無人汽車，機器人，神經網絡）網盤地址：https://pan.baidu.com/s/1G0_WS-uHeSyVvvl_4bQnlA

深度學習及計算機視覺相關資源(不斷更新)

LSTM: http://colah.github.io/posts/2015-08-Understanding-LSTMs/ 深度學習領域PyTorch專案-git原始碼整理 https://blog.csdn.net/u012969412/article/details/774792

分享《深度學習與計算機視覺演算法原理框架應用》《大資料架構詳解從資料獲取到深度學習》PDF資料集

下載：https://pan.baidu.com/s/12-s95JrHek82tLRk3UQO_w 更多資料分享：http://blog.51cto.com/3215120 《深度學習與計算機視覺演算法原理、框架應用》PDF，帶書籤，347頁。《大資料架構詳解：從資料獲取到深度學習》PDF，帶書籤，3

分享《深度學習與計算機視覺演算法原理框架應用》PDF《大資料架構詳解從資料獲取到深度學習》PDF +資料集

下載：https://pan.baidu.com/s/12-s95JrHek82tLRk3UQO_w 更多分享資料：https://www.cnblogs.com/javapythonstudy/ 《深度學習與計算機視覺演算法原理、框架應用》PDF，帶書籤，347頁。《大資料架構詳解：從資料獲取到深度學

分享《深度學習與計算機視覺算法原理框架應用》《大數據架構詳解從數據獲取到深度學習》PDF數據集

書簽部分 https log pdf 深入 -s 更多實用下載：https://pan.baidu.com/s/12-s95JrHek82tLRk3UQO_w 更多資料分享：http://blog.51cto.com/3215120 《深度學習與計算機視覺算法原理

人工智慧，深度學習，計算機視覺，自然語言處理，機器學習，百度網盤視訊教程

人工智慧，深度學習，計算機視覺，自然語言處理，機器學習視訊教程下載： 1. CS224D 2. NLP到Word2vec 3. Opencv3影象處理 4. Tensorflow 5. 機器學習 6. 人工智慧課程 7. 聊天機器人視訊教程 8. 自然語言處理獲取檔案下載連結

深度學習用於計算機視覺

密集連線層（精度97.8%）------>卷積神經網路（99.3%）兩者的區別在於：Dense層從特徵空間學到的是全域性模式，而卷積層學到時是區域性模式 1 卷積神經網路學到的模式具有平移不變性（視覺世界根本上來說就具有平移不變性），即在影象右下角學到某個模

深度學習與計算機視覺(PB-04)-rank-N準確度

在我們深入討論高階深度學習主題(如遷移學習)之前，先來了解下rank-1、rank-5和rank-N準確度的概念。當你在閱讀深度學習相關文獻時，尤其是關於計算機視覺和影象分類，你很可能會看到關於rank-N 準確度。例如，幾乎所有在ImageNet資料集上驗證的機器學習方法的論文都給出了ra

深度學習與計算機視覺(PB-03)-特徵提取

從這節開始，我們將討論關於遷移學習的內容，即用預先訓練好的模型（往往是在大型資料上訓練得到的）對新的資料進行學習. 首先，從傳統的機器學習場景出發，即考慮兩個分類任務：第一個任務是訓練一個卷積神經網路來識別影象中的狗和貓。第二個任務是訓練一個卷積神經網路識別三

深度學習與計算機視覺(PB-02)-資料增強

在深度學習實踐中，當訓練資料量少時，可能會出現過擬合問題。根據Goodfellow等人的觀點，我們對學習演算法的任何修改的目的都是為了減小泛化誤差，而不是訓練誤差。我們已經在sb[後續補充]中提到了不同型別的正則化手段來防止模型的過擬合，然而，這些都是針對引數的正則化形式，往往要求我們

深度學習與計算機視覺(PB-09)-使用HDF5儲存大資料集

到目前為止，我們使用的資料集都能夠全部載入到記憶體中。對於小資料集，我們可以載入全部影象資料到記憶體中，進行預處理，並進行前向傳播處理。然而，對於大規模資料集(比如ImageNet),我們需要建立資料生成器，每次只訪問一小部分資料集（比如mini-batch），然後對batch資料進行預處理

python3__深度學習：計算機視覺__OpenCV擴大影象資料庫

OpenCV擴大影象資料庫

1 影象的隨機裁剪

2 影象的隨機旋轉變換

3 影象色彩的隨機變換

4 對滑鼠的監控

相關推薦

python3深度學習：計算機視覺OpenCV擴大影象資料庫