1. 程式人生 > >人臉檢測真的不難,50行Python程式碼就能實現人臉檢測

人臉檢測真的不難,50行Python程式碼就能實現人臉檢測

現在的人臉識別技術已經得到了非常廣泛的應用,支付領域、身份驗證、美顏相機裡都有它的應用。用iPhone的同學們應該對下面的功能比較熟悉

iPhone的照片中有一個“人物”的功能,能夠將照片裡的人臉識別出來並分類,背後的原理也是人臉識別技術。

這篇文章主要介紹怎樣用Python實現人臉檢測。人臉檢測是人臉識別的基礎。人臉檢測的目的是識別出照片裡的人臉並定位面部特徵點,人臉識別是在人臉檢測的基礎上進一步告訴你這個人是誰。

好了,介紹就到這裡。接下來,開始準備我們的環境。

準備工作

本文的人臉檢測基於dlib,dlib依賴Boost和cmake,所以首先需要安裝這些包,以Ubuntu為例:

$ sudo apt-get install build-essential cmake
$ sudo apt-get install libgtk-3-dev
$ sudo apt-get install libboost-all-dev

我們的程式中還用到numpy,opencv,所以也需要安裝這些庫:

$ pip install numpy
$ pip install scipy
$ pip install opencv-python
$ pip install dlib

人臉檢測基於事先訓練好的模型資料,從這裡可以下到模型資料

http://dlib.net/files/shape_predictor_68_face_landmarks.dat.bz2

下載到本地路徑後解壓,記下解壓後的檔案路徑,程式中會用到。

 

dlib的人臉特徵點

上面下載的模型資料是用來估計人臉上68個特徵點(x, y)的座標位置,這68個座標點的位置如下圖所示:

我們的程式將包含兩個步驟:

第一步,在照片中檢測人臉的區域

第二部,在檢測到的人臉區域中,進一步檢測器官(眼睛、鼻子、嘴巴、下巴、眉毛)

 

人臉檢測程式碼

我們先來定義幾個工具函式:

def rect_to_bb(rect):
    x = rect.left()
    y = rect.top()
    w = rect.right() - x 
    h = rect.bottom() - y 
    return (x, y, w, h)

這個函式裡的rect是dlib臉部區域檢測的輸出。這裡將rect轉換成一個序列,序列的內容是矩形區域的邊界資訊。

 

def shape_to_np(shape, dtype="int"):
    coords = np.zeros((68, 2), dtype=dtype)
    for i in range(0, 68):
            coords[i] = (shape.part(i).x, shape.part(i).y)

    return coords

這個函式裡的shape是dlib臉部特徵檢測的輸出,一個shape裡包含了前面說到的臉部特徵的68個點。這個函式將shape轉換成Numpy array,為方便後續處理。

 

def resize(image, width=1200):
    r = width * 1.0 / image.shape[1]
    dim = (width, int(image.shape[0] * r)) 
    resized = cv2.resize(image, dim, interpolation=cv2.INTER_AREA)
    return resized

這個函式裡的image就是我們要檢測的圖片。在人臉檢測程式的最後,我們會顯示檢測的結果圖片來驗證,這裡做resize是為了避免圖片過大,超出螢幕範圍。

 

接下來,開始我們的主程式部分

import sys 
import numpy as np
import dlib
import cv2 

if len(sys.argv) < 2:
    print "Usage: %s <image file>" % sys.argv[0]
    sys.exit(1)

image_file = sys.argv[1]
detector = dlib.get_frontal_face_detector()
predictor = dlib.shape_predictor("shape_predictor_68_face_landmarks.dat")

我們從sys.argv[1]引數中讀取要檢測人臉的圖片,接下來初始化人臉區域檢測的detector和人臉特徵檢測的predictor。shape_predictor中的引數就是我們之前解壓後的檔案的路徑。

 

image = cv2.imread(image_file)
image = resize(image, width=1200)
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
rects = detector(gray, 1)

在檢測特徵區域前,我們先要檢測人臉區域。這段程式碼呼叫opencv載入圖片,resize到合適的大小,轉成灰度圖,最後用detector檢測臉部區域。因為一張照片可能包含多張臉,所以這裡得到的是一個包含多張臉的資訊的陣列rects。

 

for (i, rect) in enumerate(rects):
    shape = predictor(gray, rect)
    shape = shape_to_np(shape)

    (x, y, w, h) = rect_to_bb(rect)
    cv2.rectangle(image, (x, y), (x + w, y + h), (0, 255, 0), 2)

    cv2.putText(image, "Face #{}".format(i + 1), (x - 10, y - 10),
            cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 255, 0), 2)

    for (x, y) in shape:
            cv2.circle(image, (x, y), 2, (0, 0, 255), -1) 

cv2.imshow("Output", image)
cv2.waitKey(0)

對於每一張檢測到的臉,我們進一步檢測臉部的特徵(鼻子、眼睛、眉毛等)。對於臉部區域,我們用綠色的框在照片上標出;對於臉部特徵,我們用紅色的點標出來。

最後我們把加了檢測標識的照片顯示出來,waitKey(0)表示按任意鍵可退出程式。

以上是我們程式的全部

 

測試

接下來是令人興奮的時刻,檢驗我們結果的時刻到來了。

下面是原圖

下面是程式識別的結果

可以看到臉部區域被綠色的長方形框起來了,臉上的特徵(鼻子,眼睛等)被紅色點點標識出來了。

是不是很簡單?