MTCNN人臉檢測附完整C++代碼

阿新 • • 發佈：2018-05-05

若有文件 nta return 版本 list warnings rtt task

人臉檢測識別一直是圖像算法領域一個主流話題。

前年 SeetaFace 開源了人臉識別引擎，一度成為熱門話題。

雖然後來SeetaFace 又放出來 2.0版本，但是，我說但是。。。

沒有訓練代碼，想要自己訓練一下模型那可就犯難了。

雖然可以閱讀源碼，從前向傳播的角度，反過來實現訓練代碼，

但是誰有那個閑功夫和時間，去折騰這個呢？

有的時候還是要站在巨人的肩膀上，你才能看得更遠。

而SeetaFace 不算巨人，只是當年風口上的豬罷了。

前年，為了做一個人臉項目，也是看遍了網上各種項目。

林林總總，各有優劣。

不多做評價，很多東西還是要具體實操，實戰才能見真知。

有一段時間，用SeetaFace的人臉檢測來做一些小的演示demo，

也花了一點小時間去優化它的算法。

不過很明顯我只是把他當成玩具看待。

畢竟不能自己訓練模型，這是很大的詬病。

直到後來深度學習大放異彩，印象最深刻莫過於MTCNN。

Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Neural Networks

相關資料見：https://github.com/kpzhang93/MTCNN_face_detection_alignment

大合照下，人臉圈出來很準確，壯觀了去，這是第一印象。

上圖，大家感受一下。

技術分享圖片

MTCNN的有三個網絡結構。

Stage1: Proposal Net

技術分享圖片

Stage2: Refine Net

技術分享圖片

Stage3: Output Net

技術分享圖片

具體算法思路就不展開了。

我對MTCNN感興趣的點在於，

MTCNN的思路可以拓展到各種物體檢測和識別方向。

也許唯一缺少的就是打標好的數據，

而標註五個點，足夠用於適配大多數物體了。

符合小而美的理念，這個是我比較推崇的。

所以MTCNN是一個很值得品味的算法。

github上也有不少MTCNN的實現和資源。

基於mxnet 基於caffe 基於ncnn 等等。。。

很明顯，mxnet 和 caffe 不符合小而美的理念。

果斷拋棄了。

ncnn有點肥大，不合我心。

所以，我動了殺氣。。

移除NCNN 與mtcnn無關的層，

梳理ncnn的一些邏輯代碼。

簡單做了一些適配和優化。

砍掉一些邊邊角角。

不依賴opencv等第三方庫。

編寫示例代碼完成後，還有不少工作要做，

不過第一步感覺已經符合我的小小預期。

完整示例代碼：

#include "mtcnn.h"
#include "browse.h"
#define USE_SHELL_OPEN
#ifndef  nullptr
#define nullptr 0
#endif
#if defined(_MSC_VER)
#define _CRT_SECURE_NO_WARNINGS
#include <windows.h> 
#else
#include <unistd.h>
#endif
#define STB_IMAGE_STATIC
#define STB_IMAGE_IMPLEMENTATION

#include "stb_image.h"
//ref:https://github.com/nothings/stb/blob/master/stb_image.h
#define TJE_IMPLEMENTATION

#include "tiny_jpeg.h"
//ref:https://github.com/serge-rgb/TinyJPEG/blob/master/tiny_jpeg.h

#include <stdint.h>
#include "timing.h"

char saveFile[1024];

unsigned char *loadImage(const char *filename, int *Width, int *Height, int *Channels) {
    return stbi_load(filename, Width, Height, Channels, 0);
}

void saveImage(const char *filename, int Width, int Height, int Channels, unsigned char *Output) {
    memcpy(saveFile + strlen(saveFile), filename, strlen(filename));
    *(saveFile + strlen(saveFile) + 1) = 0;
    //保存為jpg
    if (!tje_encode_to_file(saveFile, Width, Height, Channels, true, Output)) {
        fprintf(stderr, "save JPEG fail.\n");
        return;
    }

#ifdef USE_SHELL_OPEN
    browse(saveFile);
#endif
}

void splitpath(const char *path, char *drv, char *dir, char *name, char *ext) {
    const char *end;
    const char *p;
    const char *s;
    if (path[0] && path[1] == ‘:‘) {
        if (drv) {
            *drv++ = *path++;
            *drv++ = *path++;
            *drv = ‘\0‘;
        }
    }
    else if (drv)
        *drv = ‘\0‘;
    for (end = path; *end && *end != ‘:‘;)
        end++;
    for (p = end; p > path && *--p != ‘\\‘ && *p != ‘/‘;)
        if (*p == ‘.‘) {
            end = p;
            break;
        }
    if (ext)
        for (s = end; (*ext = *s++);)
            ext++;
    for (p = end; p > path;)
        if (*--p == ‘\\‘ || *p == ‘/‘) {
            p++;
            break;
        }
    if (name) {
        for (s = p; s < end;)
            *name++ = *s++;
        *name = ‘\0‘;
    }
    if (dir) {
        for (s = path; s < p;)
            *dir++ = *s++;
        *dir = ‘\0‘;
    }
}

void getCurrentFilePath(const char *filePath, char *saveFile) {
    char drive[_MAX_DRIVE];
    char dir[_MAX_DIR];
    char fname[_MAX_FNAME];
    char ext[_MAX_EXT];
    splitpath(filePath, drive, dir, fname, ext);
    size_t n = strlen(filePath);
    memcpy(saveFile, filePath, n);
    char *cur_saveFile = saveFile + (n - strlen(ext));
    cur_saveFile[0] = ‘_‘;
    cur_saveFile[1] = 0;
}

void drawPoint(unsigned char *bits, int width, int depth, int x, int y, const uint8_t *color) {
    for (int i = 0; i < min(depth, 3); ++i) {
        bits[(y * width + x) * depth + i] = color[i];
    }
}

void drawLine(unsigned char *bits, int width, int depth, int startX, int startY, int endX, int endY,
    const uint8_t *col) {
    if (endX == startX) {
        if (startY > endY) {
            int a = startY;
            startY = endY;
            endY = a;
        }
        for (int y = startY; y <= endY; y++) {
            drawPoint(bits, width, depth, startX, y, col);
        }
    }
    else {
        float m = 1.0f * (endY - startY) / (endX - startX);
        int y = 0;
        if (startX > endX) {
            int a = startX;
            startX = endX;
            endX = a;
        }
        for (int x = startX; x <= endX; x++) {
            y = (int)(m * (x - startX) + startY);
            drawPoint(bits, width, depth, x, y, col);
        }
    }
}

void drawRectangle(unsigned char *bits, int width, int depth, int x1, int y1, int x2, int y2, const uint8_t *col) {
    drawLine(bits, width, depth, x1, y1, x2, y1, col);
    drawLine(bits, width, depth, x2, y1, x2, y2, col);
    drawLine(bits, width, depth, x2, y2, x1, y2, col);
    drawLine(bits, width, depth, x1, y2, x1, y1, col);
}

int main(int argc, char **argv) {
    printf("mtcnn face detection\n");
    printf("blog:http://cpuimage.cnblogs.com/\n");

    if (argc < 2) {
        printf("usage: %s  model_path image_file \n ", argv[0]);
        printf("eg: %s  ../models ../sample.jpg \n ", argv[0]);
        printf("press any key to exit. \n");
        getchar();
        return 0;
    }
    const char *model_path = argv[1];
    char *szfile = argv[2];
    getCurrentFilePath(szfile, saveFile);
    int Width = 0;
    int Height = 0;
    int Channels = 0;
    unsigned char *inputImage = loadImage(szfile, &Width, &Height, &Channels);
    if (inputImage == nullptr || Channels != 3) return -1;
    ncnn::Mat ncnn_img = ncnn::Mat::from_pixels(inputImage, ncnn::Mat::PIXEL_RGB, Width, Height);
    std::vector<Bbox> finalBbox;
    MTCNN mtcnn(model_path);
    double startTime = now();
    mtcnn.detect(ncnn_img, finalBbox);
    double nDetectTime = calcElapsed(startTime, now());
    printf("time: %d ms.\n ", (int)(nDetectTime * 1000));
    int num_box = finalBbox.size();
    printf("face num: %u \n", num_box);
    for (int i = 0; i < num_box; i++) {
        const uint8_t red[3] = { 255, 0, 0 };
        drawRectangle(inputImage, Width, Channels, finalBbox[i].x1, finalBbox[i].y1,
            finalBbox[i].x2,
            finalBbox[i].y2, red);
        const uint8_t blue[3] = { 0, 0, 255 };
        for (int num = 0; num < 5; num++) {
            drawPoint(inputImage, Width, Channels, (int)(finalBbox[i].ppoint[num] + 0.5f),
                (int)(finalBbox[i].ppoint[num + 5] + 0.5f), blue);
        }
    }
    saveImage("_done.jpg", Width, Height, Channels, inputImage);
    free(inputImage);
    printf("press any key to exit. \n");
    getchar();
    return 0;
}

效果圖來一個。

技術分享圖片

項目地址:

https://github.com/cpuimage/MTCNN

參數也很簡單，

mtcnn 模型文件路徑圖片路徑

例如: mtcnn ../models ../sample.jpg

用cmake即可進行編譯示例代碼，詳情見CMakeLists.txt。

若有其他相關問題或者需求也可以郵件聯系俺探討。

郵箱地址是:
[email protected]

MTCNN人臉檢測附完整C++代碼

若有文件 nta return 版本 list warnings rtt task 人臉檢測識別一直是圖像算法領域一個主流話題。前年 SeetaFace 開源了人臉識別引擎，一度成為熱門話題。雖然後來SeetaFace 又放出來 2.0版本，但是，我說但是。。。沒

音頻自動增益與靜音檢測算法附完整C代碼

kron gmm input del led sampler 文件 += frame 前面分享過一個算法《音頻增益響度分析 ReplayGain 附完整C代碼示例》主要用於評估一定長度音頻的音量強度，而分析之後，很多類似的需求，肯定是做音頻增益，提高音量諸如此類做法。

音頻自動增益與靜音檢測算法附完整C代碼【轉】

free 例如般的 ron nbsp bsp log 梳理 .cn 轉自：https://www.cnblogs.com/cpuimage/p/8908551.html 前面分享過一個算法《音頻增益響度分析 ReplayGain 附完整C代碼示例》主要用於評估一定長

音頻降噪算法附完整C代碼

公開 lob oid 算法 rtc eve init 核心語音降噪是音頻圖像算法中的必不可少的。目的肯定是讓圖片或語音更加自然平滑，簡而言之，美化。圖像算法和音頻算法都有其共通點。圖像是偏向空間處理，例如圖片中的某個區域。圖像很多時候是以二維數據為主，矩

音頻增益響度分析 ReplayGain 附完整C代碼示例【轉】

.html ssi ifdef bar read IT 輸出標準 avi 轉自：http://www.cnblogs.com/cpuimage/p/8846951.html 人們所熟知的圖像方面的3A算法有： AF自動對焦(Automatic Focus)自動對焦即調

浮點數據有損壓縮算法附完整C代碼

com ldr dct vip deb from stdio.h 也好提升在幾年前的時候在做修圖APP算法的時候，曾經一度想過對3D Lut 預設數據進行壓縮，主要用於提升用戶體驗。關於3d lut算法開源的資源也挺多的，就不多做科普了。有興趣的朋友，可以去查閱

自動曝光修復算法附完整C代碼

ted focus 展開 ESS bubuko uimage process tiny TE 眾所周知，圖像方面的3A算法有： AF自動對焦(Automatic Focus)自動對焦即調節攝像頭焦距自動得到清晰的圖像的過程 AE自動曝光(Automatic Exposur

基於傅裏葉變換的音頻重采樣算法 (附完整c代碼)

操作 endif 傅裏葉變換思路 lis fin log 替換我們前面有提到音頻采樣算法： WebRTC 音頻采樣算法附完整C++示例代碼簡潔明了的插值音頻重采樣算法例子 (附完整C代碼) 近段時間有不少朋友給我寫過郵件，說了一些他們使用的情況和問題。坦白講，我

c語言智能指針附完整示例代碼

HERE var 大坑 lan app pat pil 管理 clean 是的，你沒有看錯，不是c++不是c#，就是你認識的那個c語言。在很長一段時間裏，c的內存管理問題，層出不窮，不是編寫的時候特別費勁繁瑣，就是碰到內存泄漏排查的各種困難，特別在多線程環境下，

ionic 後臺Api服務, 使用rest-hapi , node.js 創建 RESTful API Service , 附完整源代碼

host restful view iss swagger put imageview clas opened 使用node.js創建RESTful 的API Service，可以選擇的框架有 hapi, express 等。這裏筆者推薦使用 hapi框架，會自動創建m

OpenCV人臉檢測(完整源代碼+思路)

exceptio pop ret 基礎 err 攝像 alt lena ann 本博文IDE為vs2013 OpenCV2.49 話不多說，先看視頻演示（20S演示）: 例如以下： https://v.youku.com

mp3格式轉wav格式附完整C++算法實現代碼

結果 lsa orm 掃碼 sampler mp3文件采樣率 mp3 完整近期偶然間看到一個開源項目minimp3 Minimalistic MP3 decoder single header library 項目地址: https://github.com/lieff

不用第三方解碼庫取得圖片寬高附完整C++算法實現代碼

== 實現 for break 特定 out printf chunk char* 在特定的應用場景下，有時候我們只是想獲取圖片的寬高，但不想通過解碼圖片才取得這個信息。預先知道圖片的寬高信息，進而提速圖片加載，預處理等相關操作以提升體驗。在stackoverflow

StyleCop(C#代碼檢測工具)

arp ogr 完成 mage 靜態 names sin nal lba 一、StyleCop是微軟的一個開源的靜態代碼分析工具,檢查c#代碼一致性和編碼風格。二、下載地址 http://stylecop.codeplex.com/releases/view/799

心跳機制tcp keepalive的討論、應用及“斷網”、"斷電"檢測的C代碼實現(Windows環境下)

【算法】禁忌搜索算法(Tabu Search，TS)超詳細通俗解析附C++代碼實例

-o 循環簡單全局最優更多算法什麽博文操作 01 什麽是禁忌搜索算法？ 1.1 先從爬山算法說起爬山算法從當前的節點開始，和周圍的鄰居節點的值進行比較。如果當前節點是最大的，那麽返回當前節點，作為最大值 (既山峰最高點)；反之就用最高的鄰居節點來，替換當前

C++調用C代碼的兩種方式

未定義 nbsp fin 代碼 endif log 導致 plus code 　　由於C++支持函數重載，在編譯函數代碼的時候會加上參數類型的信息，而C編譯只有函數名信息，導致C++直接調用C代碼在鏈接的時候會出現函數未定義的問題。解決這種問題有兩種方法。方法一：在寫C代碼

怎樣從C++代碼直接訪問android framework層的WifiService

-a namespace cpi 編譯 pla desc argc 封裝 conf 說究竟，Java層的service就是就C++層的binder的封裝。所以從原理上來講通過C++代碼直接訪問android framework層的service是全然可能的，這篇

C++代碼之坦克大戰（1）

過程核心形狀正方遍歷 public 開始 www 保存對坦克大戰情有獨鐘是因為大學時候第一次參加程序設計比賽就做的這個遊戲。當時用的語言是Java，那個比賽讓我悟出了面向對象的強大之處，我也是從那時開始接觸設計模式的。對我而言，坦克大戰有著非同尋常的意義，所以

學習編譯並運行C代碼

usr 源碼管理 net 哪裏爸爸默認 .org 快捷 lan 以《UNIX網絡編程》中的代碼為例，學習如何編譯並運行C代碼。根據 UNIX網絡編程（第3版）環境搭建——使用MAC OSX10.10，能夠成功運行 1、下載本書的頭文件及

MTCNN人臉檢測 附完整C++代碼

相關推薦

MTCNN人臉檢測附完整C++代碼