OpenCV學習系列：

阿新 • • 發佈：2018-11-05

最近需要對資料進行擴增以獲得更為豐富的資訊，就來了解一下OpenCV。以後每天會寫一點自己的學習要點：

1、對影象進行操作需要先獲取影象的畫素值矩陣，用cv2.imread('xxx.jpg')函式來獲取一個影象的畫素矩陣：

>>> import cv2
>>> import numpy as np

>>> img = cv2.imread('messi5.jpg')

如果是灰度圖片，如mnist grayscale image，則畫素矩陣的每個元素就是0~255的畫素值；如果是BGR彩色影象，則每個位置是一個[blue,green,red]的陣列。

>>> px = img[100,100]
>>> print px
[157 166 200]

# accessing only blue pixel
>>> blue = img[100,100,0]
>>> print blue
157


# accessing RED value
>>> img.item(10,10,2)
59

# modifying RED value
>>> img.itemset((10,10,2),100)
>>> img.item(10,10,2)
100

2、獲取影象屬性：“知己知彼，方能百戰百勝”——如果一開始我們不瞭解這個影象的情況可能後面的操作就沒法進行，比如影象的行數（高）、列數（寬），影象的資料型別、畫素數量等等；影象的shape可以直接用img.shape 得到，返回一個由行數和列陣列成的元組，如果是BGR影象還會顯示通道數“3”，即變成了三元組：

>>> print img.shape
(342, 548, 3)

>>> print img.size  # number of pixels
562248

>>> print img.dtype # image datatype 
uint8

3.分離、合併影象通道：

有時候我們需要只在影象的某一通道進行操作，就需要把那一通道的畫素值提取出來：

>>> b,g,r = cv2.split(img)
>>> img = cv2.merge((b,g,r))

或者：

>>> b = img[:,:,0]

或者你想讓所有的red pixels值為0：

>>> img[:,:,2] = 0

要注意的是cn2.split() 函式是一個很費時的操作，如非必要，考慮使用 Numpy indexing.

4、裁剪、移動影象的某一部分：

如圖，把足球平移到另一個文置：

>>> ball = img[280:340, 330:390]
>>> img[273:333, 100:160] = ball

Image ROI

OpenCV學習系列：

最近需要對資料進行擴增以獲得更為豐富的資訊，就來了解一下OpenCV。以後每天會寫一點自己的學習要點： 1、對影象進行操作需要先獲取影象的畫素值矩陣，用cv2.imread('xxx.jpg')函式來獲取一個影象的畫素矩陣： >>> import cv2 >>&

opencv學習系列：例項練習（含多個例項）

//-----------------------------------OpenCV學習------------------------------------- // 程式名稱:OpenCV程式模板樣式 // 所用IDE版本： Visua

openCV學習系列1：我為什麼要學習openCV，什麼是openCV

OpenCV：Open Source Computer Vision Library 開源計算機視覺庫個人學習openCV兩個原因：1、看好計算機視覺技術未來廣闊市場前景；2、為產品做升級引入新技術。什麼是openCV？以下內容從各種百科中整理而得: Ope

OpenCV學習系列教程第五篇：測試和提高程式碼的效率

Opencv-Python學習系列教程第五篇來自opencv-python官方學習文件，本人謹做翻譯和註釋，以及一些自己的理解本文由作者翻譯並進行程式碼驗證，轉載請註明出處~ 官方文件請參閱：https://docs.opencv.org/4.0.1/dc/d71/tutorial_py_optim

轉：深入Java集合學習系列：HashSet的實現原理

是否 abstract arc html 源代碼 cat param body static 0.參考文獻深入Java集合學習系列：HashSet的實現原理 1.HashSet概述：　　HashSet實現Set接口，由哈希表（實際上是一個HashMap實例）支持。它

機器學習系列：k 近鄰法（k-NN）的原理及實現

本內容將介紹機器學習中的 k k k 近鄰法（

【14】Caffe學習系列：計算圖片資料的均值

圖片減去均值後，再進行訓練和測試，會提高速度和精度。因此，一般在各種模型中都會有這個操作。那麼這個均值怎麼來的呢，實際上就是計算所有訓練樣本的平均值，計算出來後，儲存為一個均值檔案，在以後的測試中，就可以直接使用這個均值來相減，而不需要對測試圖片重新計算。一、二進位制格式的均值計算

【13】Caffe學習系列：資料視覺化環境（python介面)配置

caffe程式是由c++語言寫的，本身是不帶資料視覺化功能的。只能藉助其它的庫或介面，如opencv, python或matlab。更多人會使用python介面來進行視覺化，因為python出了個比較強大的東西：ipython notebook, 現在的最新版本改名叫jupyter notebook

【12】Caffe學習系列：訓練和測試自己的圖片

一、準備資料有條件的同學，可以去imagenet的官網http://www.image-net.org/download-images，下載imagenet圖片來訓練。驗證碼始終出不來需要翻牆（是google網站的驗證碼）。但是我沒有下載，原因是資料太大了。。。我去網上找了一些其它的圖片

【11】Caffe學習系列：影象資料轉換成db（leveldb/lmdb)檔案

在深度學習的實際應用中，我們經常用到的原始資料是圖片檔案，如jpg,jpeg,png,tif等格式的，而且有可能圖片的大小還不一致。而在caffe中經常使用的資料型別是lmdb或leveldb，因此就產生了這樣的一個問題：如何從原始圖片檔案轉換成caffe中能夠執行的db（leveldb/lmdb)

【10】Caffe學習系列：命令列解析

caffe的執行提供三種介面：c++介面（命令列）、python介面和matlab介面。本文先對命令列進行解析，後續會依次介紹其它兩個介面。其實大部分情況下我們會使用python介面進行呼叫，當然caffe提供了C++命令列介面，還是有必要了解一下。命令列引數有個優點是支援多GPU執行。 caf

【9】Caffe學習系列：執行caffe自帶的兩個簡單例子

為了程式的簡潔，在caffe中是不帶練習資料的，因此需要自己去下載。但在caffe根目錄下的data資料夾裡，作者已經為我們編寫好了下載資料的指令碼檔案，我們只需要聯網，執行這些指令碼檔案就行了。注意：在caffe中執行所有程式，都必須在根目錄下進行，即/caffe，否則會出錯,因為指令碼檔案

【8】Caffe學習系列：solver優化方法

上文提到，到目前為止，caffe總共提供了六種優化方法： Stochastic Gradient Descent (type: "SGD"), AdaDelta (type: "AdaDelta"), Adaptive Gradient (type: "AdaGrad"),

【7】Caffe學習系列：solver及其配置

solver算是caffe的核心的核心，它協調著整個模型的運作。caffe程式執行必帶的一個引數就是solver配置檔案。執行程式碼一般為 $ caffe train --solver=*_slover.prototxt 在Deep Learning中，往往loss function是非凸的

【6】Caffe學習系列：Blob,Layer and Net以及對應配置檔案的編寫

深度網路(net)是一個組合模型，它由許多相互連線的層（layers)組合而成。Caffe就是組建深度網路的這樣一種工具，它按照一定的策略，一層一層的搭建出自己的模型。它將所有的資訊資料定義為blobs，從而進行便利的操作和通訊。Blob是caffe框架中一種標準的陣列，一種統一的記憶體介面，它詳細

【5】Caffe學習系列：其它常用層及引數

本文講解一些其它的常用層，包括：softmax_loss層，Inner Product層，accuracy層，reshape層和dropout層及其它們的引數配置。 1、softmax-loss softmax-loss層和softmax層計算大致是相同的。softmax是一個分類器，計算的

【4】Caffe學習系列：啟用層（Activiation Layers)及引數

在啟用層中，對輸入資料進行啟用操作（實際上就是一種函式變換），是逐元素進行運算的。從bottom得到一個blob資料輸入，運算後，從top輸入一個blob資料。在運算過程中，沒有改變資料的大小，即輸入和輸出的資料大小是相等的。輸入：n*c*h*w 輸出：n*c*h*w 常用的啟用函式有

【3】Caffe學習系列：視覺層（Vision Layers)及引數

所有的層都具有的引數，如name, type, bottom, top和transform_param. 本文只講解視覺層（Vision Layers)的引數，視覺層包括Convolution, Pooling, Local Response Normalization (LRN),

【2】Caffe學習系列：資料層及引數

要執行caffe，需要先建立一個模型（model)，如比較常用的Lenet,Alex等，而一個模型由多個屋（layer）構成，每一屋又由許多引數組成。所有的引數都定義在caffe.proto這個檔案中。要熟練使用caffe，最重要的就是學會配置檔案（prototxt）的編寫。層有很多種型別，

OpenCV學習5：掩膜mask操作

什麼是掩膜（mask）定義：用選定的影象、圖形或物體，對處理的影象（全部或區域性）進行遮擋，來控制影象處理的區域或處理過程。用於覆蓋的特定影象或物體稱為掩模或模板。光學影象處理中,掩模可以足膠片、濾光片等。數字影象處理中,掩模為二維矩陣陣列,有時也用多值影象。數字影象處理中,影象掩模主要

OpenCV學習系列：

相關推薦