OpenCV3 比較CPU, OpenCL，cuda效能

阿新 • • 發佈：2018-12-12

#include <iostream>
 
#include <opencv2/opencv.hpp>
#include <opencv2/core/ocl.hpp>
#include <opencv2/core/cuda.hpp>
#include <opencv2/cudaobjdetect.hpp>
#include <opencv2/cudaimgproc.hpp>
 
 
int main(int argc, char**argv) {
    std::cout << "OpenCV version=" << std::hex << CV_VERSION << std::dec << std::endl;
 
    cv::Mat frame;
    cv::UMat uframe, uFrameGray;
    cv::cuda::GpuMat image_gpu, image_gpu_gray;
    cv::VideoCapture capture("path_to_the_video");
 
    bool useOpenCL = (argc == 2);
    std::cout << "Use OpenCL=" << useOpenCL << std::endl;
    cv::ocl::setUseOpenCL(useOpenCL);
 
    bool useCuda = (argc == 3);
    std::cout << "Use CUDA=" << useCuda << std::endl;
 
    cv::Ptr<cv::CascadeClassifier> cascade = cv::makePtr<cv::CascadeClassifier>("data/lbpcascades/lbpcascade_frontalface_at.xml");
    cv::Ptr<cv::cuda::CascadeClassifier> cascade_gpu = cv::cuda::CascadeClassifier::create("data/lbpcascades/lbpcascade_frontalface_at.xml");
 
    double time = 0.0;
    int nb = 0;
    if(capture.isOpened()) {
        for(;;) {
            capture >> frame;
            if(frame.empty() || nb >= 1000) {
                break;
            }
 
            std::vector<cv::Rect> faces;
            double t = 0.0;
            if(!useCuda) {
                t = (double) cv::getTickCount();
                frame.copyTo(uframe);
                cv::cvtColor(uframe, uFrameGray, CV_BGR2GRAY);
                cascade->detectMultiScale(uFrameGray, faces);
                t = ((double) cv::getTickCount() - t) / cv::getTickFrequency();
            } else {
                t = (double) cv::getTickCount();
                image_gpu.upload(frame);
                cv::cuda::cvtColor(image_gpu, image_gpu_gray, CV_BGR2GRAY);
                cv::cuda::GpuMat objbuf;
                cascade_gpu->detectMultiScale(image_gpu_gray, objbuf);
                cascade_gpu->convert(objbuf, faces);
                t = ((double) cv::getTickCount() - t) / cv::getTickFrequency();
            }
 
            time += t;
            nb++;
 
            for(std::vector<cv::Rect>::const_iterator it = faces.begin(); it != faces.end(); ++it) {
                cv::rectangle(frame, *it, cv::Scalar(0,0,255));
            }
            std::stringstream ss;
            ss << "FPS=" << (nb / time);
            cv::putText(frame, ss.str(), cv::Point(30, 30), cv::FONT_HERSHEY_SIMPLEX, 1.0, cv::Scalar(0,0,255));
 
            cv::imshow("Frame", frame);
            char c = cv::waitKey(30);
            if(c == 27) {
                break;
            }
        }
    }
 
    std::cout << "Mean time=" << (time / nb) << " s" << " ; Mean FPS=" << (nb / time) << " ; nb=" << nb << std::endl;
    system("pause");
    return 0;
}

lbpcascade_frontalface_at.xml 檔案可以百度搜索就能下載到，是一個級聯分類器訓練好的模型，用於識別人臉正面，很常用。具體資料可以參考http://blog.csdn.net/yang_xian521/article/details/6973667

只需要將

 cv::VideoCapture capture("path_to_the_video");

 cv::Ptr<cv::CascadeClassifier> cascade = cv::makePtr<cv::CascadeClassifier>("data/lbpcascades/lbpcascade_frontalface_at.xml");
 cv::Ptr<cv::cuda::CascadeClassifier> cascade_gpu = cv::cuda::CascadeClassifier::create("data/lbpcascades/lbpcascade_frontalface_at.xml");

結果很意外，opencl基本沒有加速效果，而cuda加速效果很明顯

OpenCV3的GPU模組需要手動重新編譯才可以使用。本文介紹了編譯OpenCV3.2.0+ GPU模組的方法

Reference:

OpenCV3 比較CPU, OpenCL，cuda效能

#include <iostream> #include <opencv2/opencv.hpp> #include <opencv2/core/ocl.hpp> #include <opencv2/core/cuda.hpp&g

以矩陣乘法為例，瞭解cpu cache對程式效能的影響

/*square1.cpp*/ /*未經優化的矩陣乘法程式*/ #include using namespace std; #define N 1000 int a[N][N] = {0}, b[N][N] = {0}, c[N][N] = {0}; int main()

mysql中IN，OR，BETWEEN效能比較

這裡的查詢條件有三種：between，or 和 in。這裡id列是索引列，如果不是的話，三個查詢都是全表掃描，效能差距應該不大。 1 準備環境程式碼如下複製程式碼 mysql> show create table tinG **********

Ubuntu 14.04 + Caffe配置記錄（CPU模式，無GPU，無Cuda）

對於使用深度學習進行影象處理，Caffe是一個不錯的框架選擇。但是安裝起來，並不是如想象中容易，稍不注意就會出錯。網上關於Ubuntu14.04下配置Caffe的資料很多，但是總是要自己親自配置才能

OpenCL和CUDA的使用比較

OpenCL和CUDA雖然不是同一個平級的東西,但是也可以橫向比較! 對OpenCL和CUDA的異同做比較: 指標遍歷OpenCL不支援CUDA那樣的指標遍歷方式, 你只能用下標方式間接實現指標遍歷. 例子程式碼如下:// CUDA struct Node

Python:通過執行100萬次列印來比較C和python的效能，以及用C和python結合來解決效能問題的方法

python作為動態語言，開發效率相當高，但如我們所知，動態語言的執行效率往往是比較低的，請看下面簡單的測試過程：一、 C語言實現100萬次列印：程式碼： #include<stdio.h> #include <time.h> int

MySQL中大於小於，IN，OR，BETWEEN效能比較

在MySQL中經常會有朋友問關於大於小於，IN，OR，BETWEEN，哪個效能更好？我想有很多朋友會用它們但確實不知道大於小於，IN，OR，BETWEEN效能哪個更好吧，下面總結一下關於大於小於，IN，OR，BETWEEN效能。這裡的查詢條件有四種：>=和<=；between；or；in 這

OpenCL和CUDA簡單比較

OpenCL和CUDA是兩種異構計算的程式設計模型。 NVIDIA在2007年正式釋出CUDA之後，一直大力推廣這種程式設計模型，主要集中在科學計算這一塊，原因是這個領域的很多應用程式屬於資料並行型別，因此利用CUDA在NVIDIA自家的GPU上加速原來單執行緒的程式一般

產品經理如何與強勢的技術溝通？技術比較有資歷，會以技術無法實現等方面的原因拒絕處理產品提出的需求。你們是否遇到這樣的技術？產品懂技術的話，是不是會好一些，因為可以和技術說“行話”了，並且產品懂技術就不會被忽悠了。

intern 世界自己人做好自己最重要的叠代開發對比不一定制造 PM在YY...作為強勢的技術來回答一下吧。說明白WHY，HOW，WHAT就好了。我想點兩個贊，u can u up，no can no bb 什麽的。微軟的win8之父年輕時候也是一個PM應

javaScript中自定義sort中的比較函數，用於比較字符串長度，數值大小

var cti lin family 字符串長度 tr1 個數 new fun var arr = [‘aa‘, 23, 1.2, ‘bb‘, ‘cc‘]; var len = arr.length; // for (var i = 0; i < len; i++)

linux查看cpu個數，核數，邏輯cpu個數

rep cut blog 部分條目 pan gre process 文件的物理CPU:物理CPU是相對於虛擬CPU而言的概念，指實際存在的處理器,就是我們可以看的見，摸得著的CPU，就是插在主板上面的。物理核：CPU中包含的物理內核個數，比如我們通常說的雙核CPU，

js基本類型和常量，比較運算符，邏輯運算符

true undefine str efi spa -1 不能十六進制變量 js基本類型和常量 Number(數字類型) 1、整型常量(10進制\8進制\16進制) 十六進制以0x或0X開頭，例如：0x8a。八進制必須以數字0開頭，例如：0123。十進制的第一位不

CPU使用率和負載，物理CPU個數，核數，線程數

線程所有 iss 正在選擇 enter fcm 若有 cpuinfo 當我們使用top命令查看系統的資源使用情況時會看到 load average，如下圖所示。它表示系統在1、5、15分鐘的平均工作負載。那麽什麽是負載(load)呢？它和CPU的利用率又有什麽關系呢

python2的比較函數，cmp

cmp div __init__ pytho col func ret ini 類型 class Shu(object): def __init__(self,ss): self.ss = ss def __str__(s

優化算法比較的實驗結果比較（BGD，SGD，MBGD，Momentum，Nesterov，Adagrad，RMSprop）

網上 deep adagrad delta 最優化優化算法最優 http 但是最近在學習神經網絡的優化算法，發現網上有很多的算法介紹，但是卻沒有算法實現和實驗對比，所以我就用python實現了BGD，SGD，MBGD，Momentum，Nesterov，Adagra

linux下GTK程式設計：顯示CPU使用率，記憶體使用率，網速。

StartOS 5.1版GNOME核心linux用了一段時間後，一直想視窗程式設計，QT最先搭建好，QT入門做了一個系統資訊，重灌系統後發現不能運行了，要安裝QT環境才能執行，於是想做一種低依賴的系統級程式設計，因為StartOS已經停止更新了，千辛萬苦第三次才成功搭建GTK環境，結合C語言對QT原

GPU，CUDA，cuDNN的理解 GPU，CUDA，cuDNN的理解

原 GPU，CUDA，cuDNN的理解 2017年08月17日 20:29:37 AI之路閱讀數：13155 &l

物理CPU，物理CPU核心，邏輯CPU，超執行緒

總核數 = 物理CPU個數 * 每顆物理CPU的核數總邏輯CPU數 = 物理CPU個數 * 每顆物理CPU的核數 X 超執行緒數 cat /proc/cpuinfo | more processor : 0 —–邏輯CPU的唯一識別符號 vendor_id : GenuineInt

JMeter深入進階效能測試體系，介面效能測試，各領域企業實戰

jmeter是apache公司基於java開發的一款開源壓力測試工具，體積小，功能全，使用方便，是一個比較輕量級的測試工具，使用起來非常簡單。因為jmeter是java開發的，所以執行的時候必須先要安裝jdk才可以。jmeter是免安裝的，拿到安裝包之後直接解壓就可以使用，同時它在linux/windows/

Linux 檢視CPU資訊，機器型號，記憶體等相關配置資訊

轉載一下以後檢視：https://my.oschina.net/hunterli/blog/140783 系統 # uname -a # 檢視核心/作業系統/CPU資訊 # head -n 1 /etc/issue # 檢視作業系統版本 # cat /proc/c

OpenCV3 比較CPU, OpenCL，cuda效能

相關推薦