OpenCV參考手冊之Mat類詳解1
類 Mat導言
OpenCV c + + n 維稠密陣列類
類 CV_EXPORTS Mat
{
public:
/ / … …很多的方法...
...
int flags;(Note :目前還不知道flags做什麼用的)
//!陣列的維數,> = 2
int dims ;
//!行和列的數量或 (-1,-1) 此時陣列已超過 2 維
int rows,cols;
//!指向資料的指標
uchar *data ;
//!指標的引用計數器 ;
/ / 陣列指向使用者分配的資料時,當指標為 NULL
int * refcount ;
/ / 其他成員
...
};
Mat類表示一個 n 維的密集數值單通道或多通道陣列。它可以用於儲存實數或複數值的向量和矩陣、灰度或彩色影象、體素、向量場、點雲、張量、直方圖 (儘管較高維的直方圖儲存在SparseMat可能更好)。M 陣列的資料佈局是由陣列 M.step[]定義的,使元素的地址(i0
addr( Mi0 ;:::;iM.dims-1) = M.data+ M.step[ 0]*i0 + M.step[ 1] *i1 + .…+ M.step[ M:dims- 1] iM:dims- 1
2維的陣列的情況下根據上述公式被減至:
addr( Mi,j)= M.data+ M.step[ 0]*i+ M.step[ 1] *j
請注意,M.step[i] > =M.step[i+1] (事實上,M.step[i] > =M.step[i+1]*M.size[i+1])。這意味著2維矩陣是按行儲存的,3 維矩陣是由平面儲存,以此類推。M.step[M.dims-1] 是最小的而且總是等於元素大小M.elemSize()。因此,Mat中的資料佈局完全相容OpenCV 1.x 中CvMat、 IplImage、 CvMatND型別。它也和標準工具包和SDK,如Numpy(ndarray),Win32(獨立裝置點陣圖)等主流的密集陣列型別相相容,也就是說,與任何使用步進(或步長)來計算畫素位置的陣列相相容。由於這種相容性,使使用者分配的資料建立Mat頭以及用OpenCV函式實時處理該頭成為可能。有很多不同的方法,建立一個Mat的物件。下面列出了最常見的選項:
使用 create(nrows,ncols,type)方法或類似的Mat(nrows,ncols,type [,fillValue])
使用 create(nrows,ncols,type)方法或類似的Mat(nrows,ncols,type [,fillValue])
建構函式。一個新的指定了大小和型別的陣列被分配。type和cvCreateMat 方法中的type引數具有相同的含義。例如,CV_8UC1 是指一個 8 位單通道陣列,CV_32FC2 指 2 通道
(復)浮點陣列,以此類推。
//建立一個用1+3j填充的 7 x 7 復矩陣。
Mat M(7,7,CV_32FC2,Scalar(1,3)) ;
/ /現在將 M轉換為100 x 60的CV_8UC(15)的矩陣。
/ / 舊內容將會被釋放
M.create(100,60,CV_8UC(15)) ;
這一章導言中指出,噹噹前的陣列與指定的陣列的形狀或型別create() 分配唯一的新陣列時的形狀或型別。
建立多維陣列:
/ / 建立 100 x 100 x 100 8 位陣列
int sz[] = {100, 100, 100};
Mat. bigCube (3,sz,CV_8U,Scalar::all(0)) ;它將維度數(= 1)傳遞給Mat的建構函式,但列數設定為 1時,建立陣列將是 2 維的。因此,Mat::dims 始終是>=2的(該陣列為空時,也可以是 0)。
使用的複製建構函式或賦值運算子可以是一個數組或右側的表示式(請參閱
下圖)。正像在導言中指出的,陣列賦值運算複雜度是O(1)因為當你需要它的時候,它僅複製頭和增加引用計數。Mat::clone() 方法可用於獲取全(深)的副本陣列。
為另一個數組的一部分構建頭。它可以是單個行、 單個列,幾個行,幾個列,矩形區域(代數中稱為較小值) 的陣列或對角線。這種操作也是複雜度為O(1),因為,新頭引用相同的資料。實際上,您可以使用此特性修改該陣列的一部分例如:
/ /第 5行,乘以 3,加到第 3 行,
M.row(3) = M.row(3) + M.row (5) * 3 ;
/ / 現在將第7列複製到第1列
/ / M.col(1) = M.col(7) ;/ / 這個不能實現。
Mat M1= M.col(1) ;
M.col(7).copyTo(M1) ;
/ / 建立一種新的 320 x 240 影象
Mat img(Size(320,240),CV_8UC3) ;
/ / 選擇ROI(region of interest)
Mat roi(img,Rect(10,10,100,100)) ;
/ / 填充 (0,255,0) 的ROI (這是RGB 空間中的綠色);
/ / 320 x 240 原始影象將被修改。
roi = Scalar(0,255,0) ;
由於額外的 datastart 和 dataend 的成員,它們使得用locateROI() 計運算元陣列在主容器陣列中的相對的位置成為可能:
Mat A = Mat::eye ( 10, 10, CV_32S);
/ / 提取 A 的1 (含)到 3 (不包含)列。
Mat B = A(Range::all(),Range(1,3)) ;
/ / 提取 B 的5 (含)到 9 (不包含)行。
/ /即 C ~ A(Range(5,9),Range (1,3))
Mat C = B(Range(5,9),Range::all()) ;
Size size;Point ofs;
C.locateROI (size,ofs);
/ / size將變為 (width= 10,height= 10),ofs會變為 (x = 1,y = 5)
考慮到整個矩陣,如果您需要深層副本,使用子矩陣的sclone() 方法的提取。
為使用者分配資料建立矩陣頭。有利於執行下列操作:
1. 使用 OpenCV處理"外來"的資料(例如,當您執行 DirectShow *filter 或 gstreamer的pro-cessing 模組,等等)。例如:
void process_video_frame (const unsignedchar * pixels,
int width,int height,int step)
{
Mat img (width,height, CV_8UC3,pixels,step);
GaussianBlur (img,img ,Size(7,7),1.5,1.5) ;
}
2.快速初始化小矩陣和/或獲取超快的元素的訪問。
double m[3] [3] = {{a,b,c},{d,e,f} {g, h, i}}};
Mat M = Mat(3,3,CV_64F,m).inv() ;
本例中使用者分配資料的一些很常見情況是從CvMat 和 IplImage 轉換到Mat。為達到此目的,有些特殊的建構函式以指向CvMat 或 IplImage 和flag可選引數指示是否資料複製。從Mat到 CvMat 或 IplImage 的後臺轉換是通過型別轉換運算子 Mat::operator CvMat() const 和 Mat::operator IplImage()實現的。operators不要複製資料。
IplImage * img = cvLoadImage("greatwave.jpg",1) ;
Mat mtx(img) ;/ / IplImage *-> Mat
CvMat oldmat = mtx ;/ / Mat-> CvMat
CV_Assert (oldmat.cols = = img-> width&& oldmat.rows = = img-> height & &
oldmat.data.ptr = = (uchar *) img->imageData & & oldmat.step = = img-> widthStep);
使用 MATLAB 樣式陣列初始值設定項zeros()、 ones()、 eye(),例如:
/ / 建立具雙精度標識矩陣並將其新增到M。
M + = Mat::eye (M.rows,M.cols,CV_64F);
使用逗號分隔的初始值設定項:
/ / 建立 3 x 3 雙精度恆等矩陣
Mat M = (Mat_ <double> (3,3) <<1,0,0,0,1,0,0,0,1) ;
使用此方法,您首先呼叫具有適當的引數的 Mat_類建構函式,然後只要把 << 運算子後面的值用逗號分隔,這些值可以是常量、變數、 表示式,等等。此外請注意所需的額外的圓括號((Mat_<double> (3,3)<< 1,0,0,0,1,0,0,0,1))以免出現編譯錯誤。
陣列一旦建立起來,它可以自動通過引用計數的機制被管理。如果陣列頭是在使用者分配的資料的基礎上構建的,您應該自己處理這些資料。當沒有指向它的引用時,陣列中的資料將被釋放。如果在陣列的析構函被呼叫之前要釋放一個由矩陣頭指向的資料,請使用Mat::release()。
掌握Array類的另一個重要的環節是元素的訪問。本手冊已經描述瞭如何計算每個陣列元素的地址。通常情況下,不需要在程式碼中直接使用的公式。如果你知道陣列元素型別(它可以使用 Mat::type() 方法檢索得到),您可以用以下方式訪問二維陣列的元素Mij:
M.at <double>(i,j) + = 1.f ;
假定 M 一個雙精度浮點型陣列。有幾個變體的不同方法來針對不同的維度數進行處理。
如果您要處理整行的二維陣列,最有效的方式是獲取該行的頭指標然後只需使用普通的 C運算子[]:
/ / 正矩陣元素之和計算
/ / (假定M 是一個雙精度矩陣)
double sum = 0;
for (int i = 0 ;i < M.rows ; i + +)
{
const double *Mi = M.ptr <double> (i) ;
for (int j = 0; j < M.cols ; j + +)
sum + = std::max(Mi [j],0.) ;
}
以上的操作中,某些操作實際上不依賴該陣列的形狀。他們只是一個接一個(或多個具有相同的座標的多個數組中的元素,例如,陣列相加)地處理陣列元素。這種操作稱為 元素指向(element-wise)。檢查是否所有的輸入/輸出陣列是連續的,即有沒有間斷在每行的結尾,是有意義的。如果是的話,將它們(這些陣列)作為單獨的一個長行來處理:
/ / 計算正矩陣元素,優化的變數的總和
double sum = 0;
int cols =M.cols,rows = M.rows ;
if(M.isContinuous())
{
cols * = rows ;
rows = 1 ;
}
for (int i = 0 ;i < rows; i + +)
{
const double * Mi = M.ptr <double>(i) ;
for (int j = 0; j < cols ; j ++)
sum + = std::max (Mi [j],0.) ;
}
對於連續的矩陣來說,外部迴圈體只需一次執行。所以,開銷是規模較小,
小型矩陣的情況下尤其明顯。
最後,還有足以成功跳過連續的行之間的間隔智慧的STL 樣式迭代器:
/ / 計算正矩陣元素和基於迭代器型別的變數之和
double sum = 0;
Mat Const Iterator_ <double> it =M.begin <double> (),it_end = M.end <double> () ;
for(; it! = it_end ; ++it)
sum+ = std::max (*it,0.);
矩陣迭代器是隨機存取的迭代器,所以他們可以被傳遞給任何 STL 演算法,包括 std::sort()。
矩陣表示式
這是已經實現的可以組合在任意複雜的表示式中的矩陣運算操作, (此處 A 、B 的表示矩陣 (Mat)、 s表示標量(Scalar),alpha為實數標量 (雙精度型):
加法、減法、求反: A + B + A-B、 A + s、 A-s、 s + A、 s-A、-A;
縮放: A * 阿爾法
每個元素乘法和除法: A.mul (B)、 A / B,alpha/A
矩陣相乘: A * B
大動脈轉位: A.t() (指在)
矩陣反演和偽反演,求解線性系統和最小二乘問題:
A.inv([method]) (~ A-1) , A.inv([method])*B (~ X: AX=B)
比較: cmpop B、 cmpop alpha、 alpha cmpop A,其中 cmpop 是以下幾種運算子之一: >,> =,= =,! =,< =,<。比較的結果是其元素設定為 255的 8 位單通道掩碼(如果特殊元素對滿足條件) 或 0。
按位邏輯運算: logicop B、 logicop s slogicop A、 ~ A,其中 logicop 是以下運算子之一: &,|, ^.
元素的最小值和最大值:分 (A、 B)、 民 (,alpha),最大值 (A,B),最大 (,alpha)
元素的絕對價值: abs(A)
叉乘,點乘: A.cross(B) A.dot(B)
任何標量與矩陣或矩陣的函式,返回一個矩陣或標量(scalar),如norm、, mean、 sum、countNonZero、trace、determinant、repeat和其他。
矩陣初始值設定項(Mat::eye(),Mat::zeros(),Mat::ones())、矩陣以逗號分隔的初始值設定項、可提取sub-matrices的m atrix建構函式和運算子,(請參見Mat的說明)。
Mat_ <destination_type> () 建構函式將結果強制轉換為適當的型別。
Note:有些逗號分隔初始值設定項和一些其他的運算子可能需要顯示呼叫Mat();或Mat_<T>();的建構函式來解決可能產生的歧義。
以下是一些矩陣表示式的例子:
//計算矩陣A的偽反演等價於A.inv(DECOMP_SVD)
SVD svd(A);
Mat pinvA =svd.vt.t()*Mat::diag(1./svd.w)*svd.u.t();
//計算萊文伯格-馬夸特演算法中的引數的新向量
x -= (A.t()*A +lambda*Mat::eye(A.cols,A.cols,A.type())).inv(DECOMP_CHOLESKY)*(A.t()*err);
//用“Unsharp Mask”演算法銳化影象
Mat blurred; double sigma = 1, threshold =5, amount = 1;
GaussianBlur(img, blurred, Size(), sigma,sigma);
Mat lowConstrastMask = abs(img - blurred)< threshold;
Mat sharpened = img*(1+amount) +blurred*(-amount);
img.copyTo(sharpened, lowContrastMask);
下面正式講解Mat的各種方法。
Mat::Mat
各種Mat建構函式。
C++: Mat::Mat()
C++: Mat::Mat(int rows, int cols, int type)
C++: Mat::Mat(Size size, int type)
C++: Mat::Mat(int rows, int cols, int type,const Scalar& s)
C++: Mat::Mat(Size size, int type, constScalar& s)
C++: Mat::Mat(const Mat& m)
C++: Mat::Mat(int rows, int cols, int type,void* data, size_t step=AUTO_STEP)
C++: Mat::Mat(Size size, int type, void*data, size_t step=AUTO_STEP)
C++: Mat::Mat(const Mat& m, constRange& rowRange, const Range& colRange)
C++: Mat::Mat(const Mat& m, constRect& roi)
C++: Mat::Mat(const CvMat* m, boolcopyData=false)
C++: Mat::Mat(const IplImage* img, boolcopyData=false)
C++: template<typename T, int n>explicit Mat::Mat(const Vec<T, n>& vec, bool copyData=true)
C++: template<typename T, int m, intn> explicit Mat::Mat(const Matx<T, m, n>& vec, bool copyData=true)
C++: template<typename T> explicitMat::Mat(const vector<T>& vec, bool copyData=false)
C++: Mat::Mat(const MatExpr& expr)
C++: Mat::Mat(int ndims, const int* sizes,int type)
C++: Mat::Mat(int ndims, const int* sizes,int type, const Scalar& s)
C++: Mat::Mat(int ndims, const int* sizes,int type, void* data, const size_t* steps=0)
C++: Mat::Mat(const Mat& m, constRange* ranges)
引數
ndims– 陣列的維數.
rows – 2維陣列中行行數
cols – Number of columnsin a 2D array.
size – 2維陣列的尺寸Size(cols, rows) .在Size()建構函式中行數和列數在次序上剛好反轉過來了。
sizes–指定 n 維陣列形狀的整數陣列。
type–陣列的型別。使用 CV_8UC1,… …,建立 1-4 通道的矩陣,CV_64FC4 或CV_8UC(n),… …,CV_64FC(n)可以建立多通道 (高達 CV_MAX_CN 通道)矩陣。
s–一個可選的初始化每個矩陣元素的引數。要在矩陣建成後將所有元素設定為特定值可以用Mat的賦值運算子Mat:operator=(constScala& value)。
data–指向使用者資料的指標。矩陣建構函式傳入data和step引數不分配矩陣資料。相反,它們只是初始化矩陣頭指向指定的資料,這意味著沒有資料的複製。此操作是很高效的,可以用來處理使用 OpenCV 函式的外部資料。外部資料不會自動釋放,所以你應該小心處理它。
step–每個矩陣行佔用的位元組數。如果任何值應包括每行末尾的填充位元組。如果缺少此引數(設定為 AUTO_STEP),假定沒有填充和實際的步長用cols*elemSize()計算。請參閱Mat::elemSize()。
steps–多維陣列(最後一步始終設定為元素大小) 的情況下的 ndims-1個步長的陣列。如果沒有指定的話,該矩陣假定為連續。
m–分配給構造出來的矩陣的陣列(作為一個整體或部分)。這些建構函式沒有複製資料。相反,指向 m 的資料或它的子陣列的頭被構造並被關聯到m上。引用計數器中無論如何都將遞增。所以,當您修改矩陣的時候,自然而然就使用了這種建構函式,您還修改 m 中的對應元素。如果你想要獨立的子陣列的副本,請使用 Mat::clone()。
img –指向老版本的 IplImage影象結構的指標。預設情況下,原始影象和新矩陣之間共享資料。但當 copyData 被設定時,完整的影象資料副本就建立起來了。
vec–矩陣的元素構成的STL 向量。矩陣可以取出單獨一列並且該列上的行數和向量元素的數目相同。矩陣的型別匹配的向量元素的型別。建構函式可以處理任意的有正確宣告的DataType型別。這意味著向量元素不支援的混合型結構,它們必須是資料(numbers)原始數字或單型數值元組。對應的建構函式是顯式的。由於 STL 向量不會自動轉換為Mat例項,您應顯式編寫 Mat(vec)。除非您將資料複製到矩陣 (copyData = true),沒有新的元素被新增到向量中,因為這樣可能會造成向量資料重新分配,並且因此使得矩陣的資料指標無效。
copyData –指定STL 向量或舊型 CvMat 或 IplImage是應複製到 (true)新構造的矩陣中 還是 (false) 與之共享基礎資料的標誌,複製資料時,使用Mat引用計數機制管理所分配的緩衝區。雖然資料共享的引用計數為 NULL,但是分配資料必須在矩陣被析構之後才可以釋放。
rowRange – m 的行數的取值範圍。正常情況下,範圍開始端具有包容性和範圍結束端是獨佔的。使用 Range::all() 來取所有的行。
colRange –m 列數的取值範圍。使用 Range::all() 來取所有的列。
ranges –表示M沿每個維度選定的區域的陣列。
expr – 矩陣表示式。請參見矩陣表示式。
以上這些都是Mat形成一個矩陣的各類建構函式。如輸出資料的自動分配中所提到的,往往預設建構函式就足夠了,不同的矩陣可以由 OpenCV 函式來分配資料空間。構造的矩陣可以進一步分配給另一個矩陣或矩陣表達或通過Mat::create()獲配。在前一種情況,舊的內容是間接引用的。
對遇到函式的記錄:
1、Mat中imread的用法:
a).呼叫格式:
A = imread(filename,fmt);
[X,map] = imread(filename,fmt);
[...] = imread(filename);
[...] = imread(URL);
[...] = imread(...,idx)(CUR,GIF,ICO, and TIFF only)
[...] = imread(...,'PixelRegion',{ROWS,COLS})(TIFF only)
[...] = imread(...,'frames',idx)(GIF only);
[...] = imread(...,ref)(HDF only)
[...] = imread(...,'BackgroundColor',BG)(PNG only);
[A,map,alpha] = imread(...)(ICO,CUR,and PNG only);
所謂圖片檔案的資料,簡單地說,就是一個二維陣列,這個二維陣列儲存著一張圖片各個畫素點的顏色索引值或顏色值,當然真正的圖片檔案還需要一些附加資訊。比如:對於24位真彩色點陣圖檔案,它的資料前14個位元組是點陣圖檔案頭(記錄圖片型別、大小、影象資料區的偏移量等),接下來的40個位元組是點陣圖資訊頭(記錄影象的長度、寬度尺寸,影象是否壓縮、影象中使用到的顏色數),然後就是記錄圖片上每個畫素點的RGB值。對於灰度影象,點陣圖資訊頭後是顏色表。
相關函式:imread、imwrite、imfinfo、fread、imshow
使用案例:
(一)、案例一
filename = 'e.bmp';
imgRgb = imread(filename);//讀入一幅彩色影象
imshow(imgRgb);//顯示彩色影象
(二)、案例二
//把24位真彩色點陣圖轉為灰度影象
filename = 'e.bmp';
imfinfo(filename);//檢視影象檔案資訊
imgRgb = imread(filename);//讀入一幅彩色影象
imshow(imgRgb);//顯示彩色影象
imgGray = rgb2gray(imgRgb);//轉為灰度圖
imshow(imgGray);//顯示轉化後的灰度影象
imwrite(imgGray,'gray.jpg');//將灰度影象儲存到影象檔案中
2、Mat中的imfinfo用法:
a) 呼叫方式:
info = imfinfo(filename,fmt)
info = imfinfo(filename);
b)圖片的寬度和高度:
fileinfo = imfinfo('D:\圖片\fengjing.bmp');
W = fileinfo.Width
H = fileinfo.Height
由此可見,該函式把點陣圖的相關資訊(點陣圖檔案頭和點陣圖資訊頭資訊)讀入一個結構體變數中。該結構體的各個成員:
Filename :檔名
FileModDate:檔案最後修改日期
FileSize:檔案總大小(位元組)
Format:檔案格式(如‘bmp’表示點陣圖檔案)
FormatVersion:'Version 3'(Microsoft Windows 3.x)
Width:影象寬度(畫素)
Height:影象高度(畫素)
BitDepth:影象灰度(24表示真彩色、8表示256色點陣圖)
ColorType:'indexed'
FormatSignature:'BM'
NumColormapEntries:顏色表中的顏色項數
Colormap:[256x3 double]
RedMask:[]
GreenMask:[]
BlueMask:[]
ImageDataOffset:影象資料區的偏移量
BitmapHeaderSize:影象檔案頭大小(固定為40位元組)
NumPlanes:1
CompressionType:影象是否壓縮
BitmapSize:120000
HorzResolution:0
VertResolution:0
NumColorUsed:使用到的顏色數(對索引點陣圖,該值表示顏色表中的顏色項數,對真彩色點陣圖,該值表示影象中實際用到的顏色數)
NumImportantColors:重要顏色數
3、Mat中的imshow用法:
a)呼叫方式:
imshow(l,n)
imshow(l,[low high]);
用指定的灰度範圍[low,high]顯示灰度影象l。顯示結果,影象中灰度值等於或低於low的都將用黑色顯示,而灰度值大於等於high的都顯示為白色,介於low和high之間的用其灰度級的預設值的中間色調顯示。如果用空矩陣即[]來代替[low high],imshow函式將會使用[min(l(:)) max(l(:))]作為第二個引數
imshow(BW)//顯示一張二值影象BW
imshow(X,map)//用指定的調色盤來顯示影象
imshow(RGB)//顯示一張真彩色影象RGB
imshow(...,display_option)
imshow(x,y,A,...)
imshow filename
h = imshow(...)
b) 程式案例:
filename = 'e.bmp'
imgRgb = imread(filename);//讀入一幅彩色影象
imshow(imgRgb);//顯示彩色影象
5、Mat中的rgb2Gray用法:
a) 函式功能:將真彩色影象轉化為灰度影象
b)呼叫格式:
I = rgb2gray(RGB);
將真彩色RGB影象轉化為灰度影象(RGB不發生變化)
newmap = rgb2gray(map);
返回一個灰度調色盤
c)相關函式:
ind2gray, mat2gray, ntsc2rgb, rgb2ind, rgb2ntsc
d)案例:
(一)、案例一
顯示RGB真彩色影象:
imgrgb = imread('flower.jpg');
figure('Name','顯示真彩色影象')
imshow(imgrgb)
(二)、案例二
imggray = rgb2gray(imgrgb);
figure('Name','顯示灰度影象');
imshow(imggray)