我的CUDA學習之旅4——Sobel運算元影象邊緣檢測CUDA實現

阿新 • • 發佈：2019-01-11

引言

關於影象邊緣檢測，記得剛開始接觸影象處理時，第一個自己實現的程式是通過筆記本攝像頭採集影象，利用OpenCV自帶的演算法庫進行Canny運算元邊緣檢測，那時候當看到程式執行後，視訊視窗實時顯示經Canny運算元邊緣分割後的影象，覺得十分有科技感，後來慢慢開始自己寫邊緣檢測的原始碼，本部落格以Sobel運算元為例，將邊緣檢測通過CUDA實現。

任務要求

輸入一張圖片，將其轉為灰度圖後，通過CUDA在GPU中對圖片實現Sobel運算元邊緣檢測，最後將結果輸出至CPU並進行顯示，要求輸出圖與用CPU內實現後的結果一致。

實現思路

關於Sobel運算元的邊緣檢測原理，可看此部落格

Sobel邊緣檢測演算法
由於檢測的原理是通過對Gx和Gy兩個方向的卷積，故在CUDA實現時我們需要正確索引到以目標畫素點為中心的3*3的小方格中各個元素的位置，由於影象從CPU端傳給GPU是一段一維連續的記憶體，增大了我們索引的難度，故在block和grid的設計上，我把整張影象完整的對映到了grid中，每個thread即對應一個畫素，通過二維索引的方法將一維的記憶體準確對映。

實現環境

VS2013 + CUDA7.5 + Opencv2.4.13

實現程式碼

#include "cuda_runtime.h"
#include "device_launch_parameters.h" 

#include <cuda.h>
#include <device_functions.h>
#include <opencv2\opencv.hpp>
#include <iostream>
using namespace std;
using namespace cv;

//Sobel運算元邊緣檢測核函式
__global__ void sobelInCuda(unsigned char *dataIn, unsigned char *dataOut, int imgHeight, int imgWidth)
{
    int xIndex = threadIdx.x + blockIdx.x * blockDim.x;
    int 
 yIndex = threadIdx.y + blockIdx.y * blockDim.y;
    int index = yIndex * imgWidth + xIndex;
    int Gx = 0;
    int Gy = 0;

    if (xIndex > 0 && xIndex < imgWidth - 1 && yIndex > 0 && yIndex < imgHeight - 1)
    {
        Gx = dataIn[(yIndex - 1) * imgWidth + xIndex + 1] + 2 * dataIn[yIndex * imgWidth + xIndex + 1] + dataIn[(yIndex + 1) * imgWidth + xIndex + 1]
            - (dataIn[(yIndex - 1) * imgWidth + xIndex - 1] + 2 * dataIn[yIndex * imgWidth + xIndex - 1] + dataIn[(yIndex + 1) * imgWidth + xIndex - 1]);
        Gy = dataIn[(yIndex - 1) * imgWidth + xIndex - 1] + 2 * dataIn[(yIndex - 1) * imgWidth + xIndex] + dataIn[(yIndex - 1) * imgWidth + xIndex + 1]
            - (dataIn[(yIndex + 1) * imgWidth + xIndex - 1] + 2 * dataIn[(yIndex + 1) * imgWidth + xIndex] + dataIn[(yIndex + 1) * imgWidth + xIndex + 1]);
        dataOut[index] = (abs(Gx) + abs(Gy)) / 2;
    }
}

//Sobel運算元邊緣檢測CPU函式
void sobel(Mat srcImg, Mat dstImg, int imgHeight, int imgWidth)
{
    int Gx = 0;
    int Gy = 0;
    for (int i = 1; i < imgHeight - 1; i++)
    {
        uchar *dataUp = srcImg.ptr<uchar>(i - 1);
        uchar *data = srcImg.ptr<uchar>(i);
        uchar *dataDown = srcImg.ptr<uchar>(i + 1);
        uchar *out = dstImg.ptr<uchar>(i);
        for (int j = 1; j < imgWidth - 1; j++)
        {
            Gx = (dataUp[j + 1] + 2 * data[j + 1] + dataDown[j + 1]) - (dataUp[j - 1] + 2 * data[j - 1] + dataDown[j - 1]);
            Gy = (dataUp[j - 1] + 2 * dataUp[j] + dataUp[j + 1]) - (dataDown[j - 1] + 2 * dataDown[j] + dataDown[j + 1]);
            out[j] = (abs(Gx) + abs(Gy)) / 2;
        }
    }
}

int main()
{
    Mat grayImg = imread("1.jpg", 0);

    int imgHeight = grayImg.rows;
    int imgWidth = grayImg.cols;

    Mat gaussImg;
    //高斯濾波
    GaussianBlur(grayImg, gaussImg, Size(3, 3), 0, 0, BORDER_DEFAULT);

    //Sobel運算元CPU實現
    Mat dst(imgHeight, imgWidth, CV_8UC1, Scalar(0));
    sobel(gaussImg, dst, imgHeight, imgWidth);

    //CUDA實現後的傳回的影象
    Mat dstImg(imgHeight, imgWidth, CV_8UC1, Scalar(0));

    //建立GPU記憶體
    unsigned char *d_in;
    unsigned char *d_out;

    cudaMalloc((void**)&d_in, imgHeight * imgWidth * sizeof(unsigned char));
    cudaMalloc((void**)&d_out, imgHeight * imgWidth * sizeof(unsigned char));

    //將高斯濾波後的影象從CPU傳入GPU
    cudaMemcpy(d_in, gaussImg.data, imgHeight * imgWidth * sizeof(unsigned char), cudaMemcpyHostToDevice);

    dim3 threadsPerBlock(32, 32);
    dim3 blocksPerGrid((imgWidth + threadsPerBlock.x - 1) / threadsPerBlock.x, (imgHeight + threadsPerBlock.y - 1) / threadsPerBlock.y);

    //呼叫核函式
    sobelInCuda << <blocksPerGrid, threadsPerBlock >> >(d_in, d_out, imgHeight, imgWidth);

    //將影象傳回GPU
    cudaMemcpy(dstImg.data, d_out, imgHeight * imgWidth * sizeof(unsigned char), cudaMemcpyDeviceToHost);

    //釋放GPU記憶體
    cudaFree(d_in);
    cudaFree(d_out);

    return 0;
}

實現結果

原圖

CPU實現後圖像

CUDA實現後圖像

通過比對發現CUDA輸出結果與CPU實現輸出結果一致~

我的CUDA學習之旅4——Sobel運算元影象邊緣檢測CUDA實現

引言

任務要求

實現思路

實現環境

實現程式碼

實現結果

我的CUDA學習之旅4——Sobel運算元影象邊緣檢測CUDA實現

我的CUDA學習之旅1——大影象分塊處理程式（包括求均值，最大值等）

java學習之旅-4

Tensorflow學習之旅(4)

Html5學習之旅(4)iframe

我的學習之旅啟程

我的WCF之旅（3）：在WCF中實現雙工通訊

Netty學習之旅----原始碼分析Netty記憶體洩漏檢測

opencv學習--opencv內的6種影象邊緣檢測演算法的實現

我的Java開發學習之旅------>Workspace in use or cannot be created, choose a different one.--錯誤解決的方法

我的RabbitMQ學習之旅3 (發布/訂閱)

我的機器學習之旅（四）：回歸與工程應用

我的機器學習之旅（六）：決策樹

我的Android之旅——學習、項目、心態

我的Python學習之旅（02）

我的Python學習之旅（01）

開發了5年android，我開始了go學習之旅

我的Web後端開發學習之旅03

記錄我的Python學習之旅（二）time庫的基本操作

記錄我的Python學習之旅（一）關於turtle庫的基本用法

我的CUDA學習之旅4——Sobel運算元影象邊緣檢測CUDA實現

引言

任務要求

實現思路

實現環境

實現程式碼

實現結果

相關推薦