計算機視覺筆記（一）初探計算機視覺

阿新 • • 發佈：2019-01-21

Outline：

1.CV背景介紹
2.OpenCV基礎
3.影象的基本操作：遍歷影象，ROI選取
4.Python環境搭建
5.機器學習在CV中的應用：KNN與Kmeans

一、什麼是Computer Vision(CV)

計算機視覺的目的：通過寫程式來解釋圖片。

影象處理：輸入影象，輸出影象
計算機視覺：輸入影象，輸出影象的理解。

二、影象處理庫

影象處理庫：
OpenCV
CxImage ~= OpenCV1.0
CImg 顯示做的好
FreeImage 大量使用指標讀速度快，讀到影象的資訊全
HALCON 商用精密測量

專案：
OpenBR 人臉識別專案
EasyPR 識別車牌

（三）OpenCV安裝配置

安裝配置參考淺墨部落格：部落格連結
因為之前學過OpenCV，所以就安裝配置了好多次了，但我一般都是用學校的電腦，筆記本上沒配。本來配置很順手了，這次遇到一個問題：無法開啟檔案“opencv_ml249d.lib”。找了半天沒找出配置步驟上出什麼問題，看淺墨部落格找到了解決方法：專案->屬性管理器->Debug|Win32->Microsoft.Cpp.Win32.userDirectories中的屬性頁面->聯結器->常規裡面的附加庫目錄中加入相應的lib檔案目錄。
還有就是，屬性管理器在圖->其他管理器裡裡，老找不著。。。

可安裝外掛ImageWatch：下載連結,能顯示Mat內容，方便除錯

（四）影象處理基礎知識

一、彩色影象儲存：BGR

二、Mat
1、常用建構函式

2、全零矩陣、全一矩陣、對角線為1矩陣

    Mat Z = Mat::zeros(2, 3, CV_8UC1);
    cout << "Z=" << Z << endl;
    Mat O = Mat::ones(2, 3, CV_32F);
    cout << "O=" << O << endl;
    Mat E = Mat::eye(2 
, 3, CV_64F);
    cout << "E=" << E << endl;

3、ROI:
1）、感興趣區域的設定

#include <iostream>
#include "opencv2/opencv.hpp"
using namespace std;
using namespace cv;

int main(int argc, char *argv[])
{
    Mat pImg = imread("Lena.jpg", 1);
    Rect rect(180, 200, 200, 200);//(x,y)=(180,200）,w=200,height=200
    Mat roi = Mat(pImg, rect);
    Mat pImgRect = pImg.clone();//深拷貝
    rectangle(pImgRect, rect, Scalar(0, 255, 0), 2);
    imshow("original image with rectangle", pImgRect);
    imshow("roi", roi);
    waitKey();
    return 0;
}

執行結果

2）、淺拷貝、深拷貝
深拷貝兩種方式：
（1）Mat pImgRect = pImg.clone();
（2）Mat pImgRect = pImg.copyto();

這裡寫圖片描述

4、畫素值的讀寫

1）.at(i, j)方式

    //灰度影象
    Mat grayim(512, 512, CV_8UC1);
    uchar value = grayim.at<uchar>(0, 0);
    for (int i = 0; i < grayim.rows; i++)
        for (int j = 0; j < grayim.cols; j++)
            grayim.at<uchar>(i, j) = (i + j) % 255;
    imshow("gray", grayim);

    //彩色影象
    Mat colorim(512, 512, CV_8UC3);
    for (int i = 0; i < colorim.rows; i++)
        for (int j = 0; j < colorim.cols; j++)
        {
            Vec3b pixel;
            pixel[0] = i % 255;//B
            pixel[1] = j % 255;//G
            pixel[2] = 0;      //R
            colorim.at<Vec3b>(i, j) = pixel;
        }
    imshow("color", colorim);

2）迭代器

//灰度影象
    Mat grayim(512, 512, CV_8UC1);
    Mat_<uchar>::iterator grayit;
    for (grayit = grayim.begin<uchar>(); grayit < grayim.end<uchar>(); grayit++)
        *grayit = rand() % 255;
    imshow("gray", grayim);

    //彩色影象
    Mat colorim(512, 512, CV_8UC3);
    Mat_<Vec3b>::iterator colorit;
    for (colorit = colorim.begin<Vec3b>(); colorit < colorim.end<Vec3b>(); colorit++)
    {
        (*colorit)[0] = rand() % 255;
        (*colorit)[1] = rand() % 255;
        (*colorit)[2] = rand() % 255;
    }
    imshow("color", colorim);

3）、指標按行遍歷

    Mat grayim(512, 512, CV_8UC1,Scalar(0));
    for (int i = 0; i < grayim.rows; i++)
    {
        uchar *p = grayim.ptr<uchar>(i);
        for (int j = 0; j < grayim.cols; j++)
            p[j] = rand() % 255;
    }
    imshow("gray", grayim);

4）、Mat_類

Mat M(512, 512, CV_8UC1);
    Mat_<uchar> M1 = (Mat_<uchar>&)M;
    for (int i = 0; i < M1.rows; i++)
    {
        uchar *p = M1.ptr(i);
        for (int j = 0; j < M1.cols; j++)
        {
            double d1 = (double)((i + j) % 255);
            M1(i, j) = d1;
            double d2 = M1(i, j);
        }
    }

5）、一般有對映關係時使用

查詢表（降低灰度級，提高運算速度）

量化公式，降低灰度級

Mat M(512, 512, CV_8UC1);
    Mat_<uchar> M1 = (Mat_<uchar>&)M;
    for (int i = 0; i < M1.rows; i++)
    {
        uchar *p = M1.ptr(i);
        for (int j = 0; j < M1.cols; j++)
        {
            double d1 = (double)((i + j) % 255);
            M1(i, j) = d1;
            double d2 = M1(i, j);
        }
    }
    Mat Out;
    int divideWith = 10;
    uchar table[256];
    for (int i = 0; i < 256; i++)
        table[i] = divideWith*(i / divideWith);

    Mat lookUpTable(1, 256, CV_8U);
    uchar *p = lookUpTable.data;
    for (int i = 0; i < 256; i++)
        p[i] = table[i];
    LUT(M, lookUpTable, Out);
    imshow("origin", M);
    imshow("result", Out);

這裡寫圖片描述

5、資料獲取與儲存

1）imread

Mat pImg = imread("Lena.jpg", 1);
//flag=0,強制轉換為單通道，flag=1不改變

2）imwrite
8U的可以轉化為影象看手冊
直接覆蓋

6、video讀寫類

1）讀視訊

//讀視訊
    //VideoCapture cap(0);  //攝像頭id
    VideoCapture cap("video.avi");  //本地視訊
    if (!cap.isOpened())
    {
        cerr << "Can not open a camera or file." << endl;
        return -1;
    }
    Mat edges;
    namedWindow("edges", 1);
    for (;;)
    {
        Mat frame;
        cap >> frame;
        if (frame.empty())
            break;

        imshow("frame", frame);

        if (waitKey(30) >= 0)
            break;
    }

    waitKey();

2）寫視訊

    Size s(320, 240);
    VideoWriter writer = VideoWriter("myvideo.avi", CV_FOURCC('M', 'J', 'P', 'G'), 25, s);
    if (!writer.isOpened())
    {
        cerr << "Can not creat a video." << endl;
        return -1;
    }
    Mat frame(s, CV_8UC3);
    for (int i = 0; i < 100; i++)
    {
        writer << frame;
    }

（五）python

涉及到深度學習與機器學習相關的內容，所以要學習一下python

python環境的安裝，建議Anaconda+Ipython(Jupyter )+(PyScripter)(版本2.7比較流行或者3.5都可以)

python教程：基礎教程網站

Anaconda下載：
官網下載
官網下載容易出現下載失敗！真的不要嘗試在官網下載。下了好幾次，動不動就是連結斷開下載失敗的。。

（劃重點）從國內清華大學開源軟體映象站進行下載並配置映象。連結
推薦一個下載安裝教程
致Python初學者們 - Anaconda入門使用指南連結地址

Jupyter notebook 使用教程

（六）機器學習

1、機器學習：要隨機地觀測資料，要隨機地對觀測資料進行取樣，要學習資料的性質（也叫做特徵feature）以及屬性（通常叫做label，它是屬於哪個類別的），然後再來預測新的未知資料的屬性。在機器學習，通常把資料分為兩部分，一部分是訓練集training，一部分是測試集test，兩部分相互獨立。

2、監督式學習（除了資料以外，還有額外的屬性，如feature&label）：分類和迴歸
分類：輸出是離散的。例：根據各種特徵，將一個群體，分成幾種。
迴歸：輸出連續的。例：根據年齡體重，預測身高。
監督學習主要是分類，儘量把問題轉化為分類問題。

3、非監督式學習（沒有額外的label）：聚類和核密度估計
聚類：K-means演算法。

（七）KNN（分類）

當求未知專案的類別時，先探測周圍專案是什麼類別。轉換成演算法：
第一種實現思路：
用一條線把這兩個區域分開，叫決策邊界，把所有資料一分為二。但是要求資料必須是線性可分的，如果資料複雜的時候，就要做非線性的變換了，把資料對映到多維空間中，讓它成為線性可分的。

第二種思路：
就是Knn演算法：參考待測點周圍最近的k個數據的label是什麼，將出現頻率最高的label作為該點的預測結果。

Knn作為一種機器學習的演算法也分為兩部分
訓練：把訓練集和標籤全部儲存，比如說給下圖這樣一個訓練影象，把下圖和它的label（5）儲存，把這些儲存完，它就學習完畢了。

測試：提供測試集，沒有標籤，讓演算法猜這是什麼，要指定K的大小。

劣勢：沒有訓練，測試的時候需要把所有訓練集都拿來和測試的資料一一比對，比對就涉及距離問題，測試兩個向量的距離。
優勢：簡單。當資料不是線性的時候，表現比其他分類器好一些。

引數K的選擇一般不大於20。

示例：
//補充

（八）K-means（聚類）

聚類演算法

K-means

主要做法：選取一個點，對於一堆資料，把它聚成n類。

示例：我們有一堆資料，指定三個資料，把它們聚成三類。

K1,K2,K3指定之後，找到離它最近的一個數據作為center，進行label，把資料分成三個label，在相同label的資料中求均值，定義均值作為新的中心，進行迴圈迭代，直到收斂為止，停止條件是中心變化很小或者是所有資料的label已經不變了。

Example：顏色降維

計算機視覺筆記（一）初探計算機視覺

Outline：

一、什麼是Computer Vision(CV)

二、影象處理庫

（三）OpenCV安裝配置

（四）影象處理基礎知識

（五）python

（六）機器學習

（七）KNN（分類）

（八）K-means（聚類）

計算機視覺筆記（一）初探計算機視覺

計算機網路筆記（一）【謝希仁編著】

朱老師ARM裸機學習筆記（一）：計算機基礎知識

Python資料分析入門（一）——初探資料視覺化

Caffe視覺化（一）：網路結構視覺化（用Caffe自帶程式實現）

計算機視覺系列：學習筆記（一）

2017CS231n李飛飛深度視覺識別筆記（一）——計算機視覺概述和歷史背景

計算機視覺入門（一）

《編碼-隱匿在計算機背後的語言》 —— 讀書筆記（一）：編碼

《深入理解計算機系統》——讀書筆記（一）

計算機視覺之（一）利用Harris檢測子進行角點特徵檢測（含matlab原始碼）

程式設計師面試寶典隨筆記（一）----計算機網路知識點梳理

《深入理解計算機系統》學習筆記（一）

計算機模擬技術學習筆記（一）

計算機網路讀書筆記（一）概述

CSSAPP稀裡糊塗的讀書筆記（一）計算機系統漫遊

《計算機網路（第七版）》讀書筆記（一）概述

計算機圖形學學習筆記（一）：概述，直線掃描轉換演算法：DDA，中點畫線演算法，Bresenham演算法

深入理解計算機系統學習筆記（一）

[計算機基礎]計算機系統學習筆記（一）

計算機視覺筆記（一） 初探計算機視覺

Outline：

一、什麼是Computer Vision(CV)

二、影象處理庫

（三）OpenCV安裝配置

（四）影象處理基礎知識

（五）python

（六）機器學習

（七）KNN（分類）

（八）K-means（聚類）

相關推薦

計算機視覺筆記（一）初探計算機視覺