OpenCV開發筆記（七十二）：紅胖子8分鐘帶你使用opencv+dnn+tensorFlow識別物體

阿新 • • 發佈：2020-10-24

前言

級聯分類器的效果並不是很好，準確度相對深度學習較低，本章使用opencv通過tensorflow深度學習，檢測已有模型的分類。

Demo

可以猜測，1其實是人，18序號類是狗，因為筆者未找到對應的分類具體資訊。

Tensorflow模型下載

https://github.com/opencv/opencv_extra
（注意：未找到對應的分類具體資訊。）

OpenCV深度識別基本流程

opencv3.4.x支援了各種模型。

支援的模型

opencv3.4.x支援一下深度學習的模型：
- caffe：.caffemodel
官網：http://caffe.berkeleyvision.org
- tensorflow：.pb
官網：https://www.tensorflow.org
- torch：.t7 | .net
官網：http://torch.ch
- darknet：.weights
官網：https://pjreddie.com/darknet
- DLDT：.bin
官網：https://software.intel.com/openvino-toolkit

操作步驟：tensorflow

步驟一：載入模型和配置檔案，建立神經網路。
根據不同的模型，使用cv::dnn::readNetFromXXX系列函式進行讀取，opencv3.4.x系列支援的dnn模型（支援模型往上看）。
舉例tensorflow模型如下：

std::string weights = "E:/qtProject/openCVDemo/dnnData/" \
                      "ssd_mobilenet_v1_coco_2017_11_17/frozen_inference_graph.pb";
std::string prototxt = "E:/qtProject/openCVDemo/dnnData/" \
                      "ssd_mobilenet_v1_coco_2017_11_17.pbtxt";
cv::dnn::Net net = cv::dnn::readNetFromTensorflow(weights, prototxt);

步驟二：將要預測的圖片加入到神經網路中
加入之後，需要識別圖片，那麼需要把圖片輸入到神經網路當中去，如下：

cv::Mat mat;
cv::Mat blob;
mat = cv::imread("E:/testFile/14.jpg");
cv::dnn::blobFromImage(mat, blob);

步驟三：分類預測，獲取識別的結果
輸入之後，就進行識別，識別是向前預測（分類預測），並且拿到結果。

cv::Mat prob = net.forward();

對於預測的結果，存於cv::Mat型別的prob，然後需要統一對prob進行處理，使其成為我們可以使用的資料，程式碼如下：

cv::Mat detectionMat(prob.size[2], prob.size[3], CV_32F, prob.ptr<float>());

對於從結果prob轉換為detectionMat後，其結構如下：
cv::Mat為多行七列，每一行代表一個檢測到的分類，具體列資訊如下表：

（注意：具體的使用，請參照“步驟四”）

步驟四：對達到置信度的可以通過輸出的mat進行分類和框選

cv::Mat detectionMat(prob.size[2], prob.size[3], CV_32F, prob.ptr<float>());
// 置信度預製，大於執行度的將其使用rect框出來
float confidenceThreshold = 0.75;
for(int i = 0; i < detectionMat.rows; i++)
{
    float confidence = detectionMat.at<float>(i, 2);
    if (confidence > confidenceThreshold)
    {
        // 高於置信度的，獲取其x、y、以及對應的寬度高度，進行框選
        int classId = (detectionMat.at<float>(i, 1));
        int xLeftBottom = static_cast<int>(detectionMat.at<float>(i, 3) * mat.cols);
        int yLeftBottom = static_cast<int>(detectionMat.at<float>(i, 4) * mat.rows);
        int xRightTop = static_cast<int>(detectionMat.at<float>(i, 5) * mat.cols);
        int yRightTop = static_cast<int>(detectionMat.at<float>(i, 6) * mat.rows);
        cv::Rect object((int)xLeftBottom,
                     (int)yLeftBottom,
                     (int)(xRightTop - xLeftBottom),
                     (int)(yRightTop - yLeftBottom));
        cv::rectangle(mat, object, cv::Scalar(0, 255, 0), 2);
        qDebug() << __FILE__ << __LINE__
                << classId
                << confidence << confidenceThreshold
                << object.x << object.y << object.width << object.height;
    }
}

函式原型

讀取tensorflow模型與配置檔案函式原型

Net readNetFromTensorflow(const String &model,
                         const String &config = String());

從檔案中讀取。

引數一：用二進位制協議描述網路體系結構的.pb檔案的路徑；
引數二：包含protobuf格式的文字圖形定義的.pbtxt檔案的路徑。生成的網路物件由文字圖構建，使用來自二進位制的權重讓我們更靈活些；

Net readNetFromTensorflow(const std::vector<uchar>& bufferModel,
                         const std::vector<uchar>& bufferConfig = std::vector<uchar>());

從快取中讀取。

引數一：包含pb檔案內容的bufferModel緩衝區；
引數二：包含pbtxt檔案內容的bufferConfig緩衝區；

Net readNetFromTensorflow(const char *bufferModel,
                        size_t lenModel,
                        const char *bufferConfig = NULL,
                        size_t lenConfig = 0);

引數一：包含pb檔案內容的bufferModel緩衝區；
引數二：bufferModel緩衝長度；
引數三：包含pbtxt檔案內容的bufferConfig緩衝區；
引數四：bufferConfig緩衝長度；
讀取圖片（需要識別的）函式原型

Mat blobFromImage(InputArray image,
                  double scalefactor=1.0,
                  const Size& size = Size(),
                  const Scalar& mean = Scalar(),
                  bool swapRB=false,
                  bool crop=false,
                  int ddepth=CV_32F);

void blobFromImage(InputArray image,
                  OutputArray blob,
                  double scalefactor=1.0,
                  const Size& size = Size(),
                  const Scalar& mean = Scalar(),
                  bool swapRB=false,
                  bool crop=false,
                  int ddepth=CV_32F);.

Mat blobFromImages(InputArrayOfArrays images,
                   double scalefactor=1.0,
                   Size size = Size(),
                   const Scalar& mean = Scalar(),
                   bool swapRB=false, 
                   bool crop=false,
                   int ddepth=CV_32F);

void blobFromImages(InputArrayOfArrays images,
                   OutputArray blob,
                   double scalefactor=1.0,
                   Size size = Size(),
                   const Scalar& mean = Scalar(),
                   bool swapRB=false,
                   bool crop=false,
                   int ddepth=CV_32F);

從影象建立區域。可選擇從中心調整和裁剪影象。

引數一：影象輸入影象（1、3或4通道）；
引數二：大小輸出影象的空間大小；
引數三：從通道中減去平均值的平均標量。價值是有意的，如果image有BGR順序，swapRB為真，則按（mean-R，mean-G，mean-B）順序排列；
引數四：影象值的縮放因子乘數；
引數五：swapRB標誌，指示交換第一個和最後一個通道，在三通道影象是必要的；
引數六：裁剪標誌，指示調整大小後是否裁剪影象；
引數七：輸出blob的深度，選擇CV_32F或CV_8U；

設定神經網路輸入函式原型

void cv::dnn::Net::setInput(InputArray blob,
                      const String& name = "",
                      double scalefactor = 1.0,
                      const Scalar& mean = Scalar());

設定網路的新輸入值。

引數一：一個新的blob。應具有CV_32F或CV_8U深度。
引數二：輸入層的名稱。
引數三：可選的標準化刻度。
引數四：可選的平均減去值。

深度檢測識別（向前預測）函式原型

void cv::dnn::Net::Mat forward(const String& outputName = String());

向前預測，返回指定層的第一個輸出的blob，一般是返回最後一層，可使用cv::Net::getLayarNames()獲取所有的層名稱。

引數一：outputName需要獲取輸出的層的名稱

Demo原始碼

void OpenCVManager::testTensorflow()
{
    // 訓練好的模型以及其模型的字尾名
    // .caffemodel (Caffe, http://caffe.berkeleyvision.org/)
    // .pb (TensorFlow, https://www.tensorflow.org/)
    // .t7 | *.net (Torch, http://torch.ch/)
    // .weights (Darknet, https://pjreddie.com/darknet/)
    // .bin (DLDT, https://software.intel.com/openvino-toolkit)

    // https://github.com/opencv/opencv/wiki/TensorFlow-Object-Detection-API

    std::string weights = "E:/qtProject/openCVDemo/dnnData/" \
                          "ssd_mobilenet_v1_coco_2017_11_17/"frozen_inference_graph.pb";
    std::string prototxt = "E:/qtProject/openCVDemo/dnnData/" \
                           "ssd_mobilenet_v1_coco_2017_11_17.pbtxt";
    cv::dnn::Net net = cv::dnn::readNetFromTensorflow(weights, prototxt);

    if(net.empty())
    {
        qDebug() << __FILE__ << __LINE__ << "net is empty!!!";
        return;
    }
    cv::Mat mat;
    cv::Mat blob;

    // 獲得所有層的名稱和索引
    std::vector<cv::String> layerNames = net.getLayerNames();
    int lastLayerId = net.getLayerId(layerNames[layerNames.size() - 1]);
    cv::Ptr<cv::dnn::Layer> lastLayer = net.getLayer(cv::dnn::DictValue(lastLayerId));
    qDebug() << __FILE__ << __LINE__
             << QString(lastLayer->type.c_str())
             << QString(lastLayer->getDefaultName().c_str())
             << QString(layerNames[layerNames.size()-1].c_str());

#if 0
    // 視訊裡面的識別
    cv::VideoCapture capture;
    if(!capture.open("E:/testFile/4.avi"))
    {
        qDebug() << __FILE__ << __LINE__ << "Failed to open videofile!!!";
        return;
    }
#endif

    while(true)
    {
#if 1
        // 讀取圖片識別
        mat = cv::imread("E:/testFile/15.jpg");
        if(!mat.data)
        {
            qDebug() << __FILE__ << __LINE__ << "Failed to read image!!!";
            return;
        }
#else
        // 視訊裡面的識別
        capture >> mat;
        if(mat.empty())
        {
            cv::waitKey(0);
            break;
        }
#endif

        cv::dnn::blobFromImage(mat, blob);

        net.setInput(blob);
        // 推理預測：可以輸入預測的圖層名稱
//        cv::Mat prob = net.forward("detection_out");
        cv::Mat prob = net.forward();

        // 顯示識別花費的時間
        std::vector<double> layersTimes;
        double freq = cv::getTickFrequency() / 1000;
        double t = net.getPerfProfile(layersTimes) / freq;
        std::string label = cv::format("Inference time: %.2f ms", t);
        cv::putText(mat, label, cv::Point(0, 15), cv::FONT_HERSHEY_SIMPLEX, 0.5, cv::Scalar(0, 255, 0));

        cv::Mat detectionMat(prob.size[2], prob.size[3], CV_32F, prob.ptr<float>());

        // 置信度預製，大於執行度的將其使用rect框出來
        float confidenceThreshold = 0.75;
        for(int i = 0; i < detectionMat.rows; i++)
        {
            float confidence = detectionMat.at<float>(i, 2);
            if (confidence > confidenceThreshold)
            {
                // 高於置信度的，獲取其x、y、以及對應的寬度高度，進行框選
                int classId = (detectionMat.at<float>(i, 1));
                int xLeftBottom = static_cast<int>(detectionMat.at<float>(i, 3) * mat.cols);
                int yLeftBottom = static_cast<int>(detectionMat.at<float>(i, 4) * mat.rows);
                int xRightTop = static_cast<int>(detectionMat.at<float>(i, 5) * mat.cols);
                int yRightTop = static_cast<int>(detectionMat.at<float>(i, 6) * mat.rows);
                cv::Rect object((int)xLeftBottom,
                                (int)yLeftBottom,
                                (int)(xRightTop - xLeftBottom),
                                (int)(yRightTop - yLeftBottom));
                cv::rectangle(mat, object, cv::Scalar(0, 255, 0), 2);
                qDebug() << __FILE__ << __LINE__
                         << classId
                         << confidence << confidenceThreshold
                         << object.x << object.y << object.width << object.height;
            }
         }
        cv::imshow(_windowTitle.toStdString(), mat);
        cv::waitKey(0);
    }
}

對應工程模板v1.64.0

openCVDemo_v1.64.0_基礎模板_tensorFlow分類檢測.rar。

入坑

入坑一：載入模型時候錯誤

錯誤

原因
.pb模型檔案與.pbtxt檔案不對應，版本也有關係。
解決
更換模型，使用正確的pb與pbtxt對應的檔案。

上一篇：《OpenCV開發筆記（七十一）：紅胖子8分鐘帶你深入級聯分類器訓練》
下一篇：持續補充中…

OpenCV開發筆記（七十二）：紅胖子8分鐘帶你使用opencv+dnn+tensorFlow識別物體

前言級聯分類器的效果並不是很好，準確度相對深度學習較低，本章使用opencv通過tensorflow深度學習，檢測已有模型的分類。 Demo 可以猜測，1其實是人，18序號類是狗，因為筆者未找到對應的分類具體資訊。 Tensorflow模型

OpenCV開發筆記（七十一）：紅胖子8分鐘帶你深入級聯分類器訓練

前言紅胖子，來也！做影象處理，經常頭痛的是明明分離出來了（非顏色的），分為幾塊區域，那怎麼知道這幾塊區域到底哪一塊是我們需要的，那麼這部分就涉及到需要識別了。識別可以自己寫模板匹配、特徵點識別、級聯分類器訓練識別。本文章就是講解級聯分類器的訓練與識別。明確目標目標是識

OpenCV開發筆記（六十九）：紅胖子8分鐘帶你使用傳統方法識別已知物體（圖文並茂+淺顯易懂+程式原始碼）

若該文為原創文章，未經允許不得轉載原博主部落格地址：https://blog.csdn.net/qq21497936原博主部落格導航：https://blog.csdn.net/qq21497936/article/details/102478062本文章部落格地址：https://blog.csdn.ne

OpenCV開發筆記（五十五）：紅胖子8分鐘帶你深入瞭解Haar、LBP特徵以及級聯分類器識別過程（圖文並茂+淺顯易懂+程式原始碼）

OpenCV開發筆記（六十五）：紅胖子8分鐘帶你深入瞭解ORB特徵點（圖文並茂+淺顯易懂+程式原始碼）

OpenCV開發筆記（七十三）：紅胖子8分鐘帶你使用opencv+dnn+yolov3識別物體

前言級聯分類器的效果並不是很好，準確度相對深度學習較低，上一章節使用了dnn中的tensorflow，本章使用yolov3模型，識別出具體的分類。 Demo 320x320，置信度0.6 608x608，置信度0.6（.cfg裡面是608） &nb

OpenCV開發筆記（七十）：紅胖子帶你傻瓜式編譯VS2017x64版本的openCV4

前言紅胖子來也！！！ opencv_contrib是opencv提供額外的工具，提供一些基礎演算法，之前編譯了不帶opencv_contrib的版本，不帶opencv_contrib的cuda硬加速版本， opencv+opentrib的版本。 OpenCV4是最新的版本，編譯一個openCV

Java開發筆記（三十二）字符型與整型相互轉化

傳播 out 字母 href 不但 java 個數進制數 com 前面提到字符類型是一種新的變量類型，然而編碼實踐的過程中卻發現，某個具體的字符值居然可以賦值給整型變量！就像下面的例子代碼那樣，把字符值賦給整型變量，編譯器不但沒報錯，而且還能正常運行！ // 字符允許

Java開發筆記（三十二）字元型與整型相互轉化

前面提到字元型別是一種新的變數型別，然而編碼實踐的過程中卻發現，某個具體的字元值居然可以賦值給整型變數！就像下面的例子程式碼那樣，把字元值賦給整型變數，編譯器不但沒報錯，而且還能正常執行！ // 字元允許直接賦值給整型變數 private static void charToInt() { i

Java開發筆記（四十二）日曆工具的常見應用

前面介紹了日曆工具Calendar的基本用法，乍看起來Calendar與Date兩個半斤八兩，似乎沒有多大區別，那又何苦庸人自擾鼓搗一個新玩意呢？顯然這樣小瞧了Calendar，其實它的作用大著呢，接下來不妨深入探討一下Calendar的幾種實際應用，主要包括：Calendar和Date

Java開發筆記（五十二）對象的類型檢查

可靠 all 取值得到 tar int 獲取介紹 instance 前面介紹了類的多態性，來自於雞類的實例chicken，既能用來表達公雞實例，也能用來表達母雞實例。可是這導致了一個問題，假如在call方法內部需要手工判斷輸入參數屬於公雞實例還是母雞實例，那該如何是好？

OpenCV學習筆記（六十二）——《OpenCV Computer Version with Python》閱讀摘要

現在python火啊，每次OpenCV自帶的ml模組都讓我直呼坑爹，索性準備用python來做OpenCV後期的機器學習演算法的處理。於是趕緊拿起這本書讀讀。適合OpenCV和python都有一定基礎的。。。。由於都比較熟悉這兩個東西，我閱讀之前比較關心的只有幾個問題，具

Java開發筆記（七十一）容器工具Collections

collect ava 支持能夠泛型接口代碼例子 lam private 使用清單作為一組數據的有序隊列，它在組織形式上與數組有著某些異曲同工之處，數組有專門的數組工具Arrays來進行加工操作，照理清單也應該配備對應的清單工具。當然容器這個大家族確實擁有自己的容器

Java開發筆記（七十八）面向對象的後門——反射

catch etc 包名門面相對 class類 system 有關 eth 作為一門面向對象的編程語言，Java認為一切皆是對象，每個對象都能歸屬於某個類，甚至每個類均可提取出一種特殊的類型，即Class類型。早在前面介紹多態的時候，就提到每個類都存在獨一無二的基因，通

Django學習筆記（三十二）：datetime.timedelta類介紹

datetime.timedelta物件代表兩個時間之間的時間差，兩個date或datetime物件相減就可以返回一個timedelta物件。如果有人問你昨天是幾號，這個很容易就回答出來了。但是如果問你200天前是幾號，就不是那麼容易答出來。而在Python中dateti

Unity3D學習筆記（三十二）：Xlua（2）

使用 ceil list date action oat static arp 分享 Xlua支持通過子類對象訪問父類的變量屬性和方法對於C#的ref，out參數的方法當調用的時候：out類型的參數是不需要傳遞實參的，普通的參數和ref參數需要傳遞實參。 out，r

Android開發筆記（七十七）圖片快取演算法

ImageCache 由於手機流量有限，又要加快app的執行效率，因此好的app都有做圖片快取。圖片快取說起來簡單，做起來就用到很多知識點，可算是集Android技術之大全了。只要理解圖片快取的演算法，並加以實踐把它做好，我覺得差不多可以懂半個Android的開發。快取策略

Java開發筆記（七十七）使用Optional規避空指針異常

代碼優化解決問題 https tar 是否思路 element 代碼示例技術前面在介紹清單用法的時候，講到了既能使用for循環遍歷清單，也能通過stream流式加工清單。譬如從一個蘋果清單中挑選出紅蘋果清單，采取for循環和流式處理都可以實現。下面是通過for循環挑

salesforce零基礎學習（七十二）項目中的零碎知識點小總結（一）

gin 不同 grant dmi ima -m ron 角色 com 項目終於告一段落，雖然比較苦逼，不過也學到了好多知識，總結一下，以後當作參考。一.visualforce標簽中使用html相關的屬性使用曾經看文檔沒有看得仔細，導致開發的時候走了一些彎路。還好得到

Linux學習筆記（三十二）iptables filter表案例、 iptables nat表應用

iptables filter表案例、 iptables nat表應用一、iptables filter表案例需求：將80、20、21端口放行，對22端口指定特定的ip才放行以下為操作方法：vim /usr/local/sbin/iptables.sh //加入如下內容#! /bin/bas

OpenCV開發筆記（七十二）：紅胖子8分鐘帶你使用opencv+dnn+tensorFlow識別物體

Demo

Tensorflow模型下載

OpenCV深度識別基本流程

支援的模型

操作步驟：tensorflow

函式原型

設定神經網路輸入函式原型

深度檢測識別（向前預測）函式原型

Demo原始碼

對應工程模板v1.64.0

入坑

入坑一：載入模型時候錯誤

相關推薦