人臉性別和年齡識別

阿新 • • 發佈：2018-11-10

本文是對age-gender-estimation專案的詳細講解，它給出了使用keras進行性別和年齡識別的完整流程。

資料

採用的資料集為imdb-wiki，這是一個包含 20,284名人的460,723張以及維基百科上imdb的 62,328張共計523,051 張人臉影象的資料集，是目前開源的資料集中量級最大的，它給出了影象中人物的性別和出生時間、照片的拍攝時間等資訊。原始的圖片很大，分成了9個部分共計100多G，而裁剪出人臉的圖片比較小，只有3G多，因此大家使用的基本都是wiki.tar.gz，不需要註冊，直接就可以下載，這點很良心，省去了很多下載話費的時間。

解壓後的目錄為100個子資料夾，每個子資料夾再儲存圖片檔案。

不過由於是採用matlab的mat格式檔案儲存的，實際用起來還要做一些轉化。裡面還含有一些噪聲，比如性別標記為NAN,年齡算出來不對等，我寫了一些程式碼來對這些資訊進行過濾和統計

import os
import numpy as np
from scipy.io import loadmat
from datetime import datetime
from tqdm import tqdm
import matplotlib.pyplot as plt

def calc_age(taken, dob):
    birth = datetime.fromordinal(max(int(dob) - 366, 1))

    # assume the photo was taken in the middle of the year
    if birth.month < 7:
        return taken - birth.year
    else:
        return taken - birth.year - 1

def get_meta(mat_path, db):
    meta = loadmat(mat_path)
    full_path = meta[db][0, 0]["full_path"][0]
    dob = meta[db][0, 0]["dob"][0]  # Matlab serial date number
    gender = meta[db][0, 0]["gender"][0]
    photo_taken = meta[db][0, 0]["photo_taken"][0]  # year
    face_score = meta[db][0, 0]["face_score"][0]
    second_face_score = meta[db][0, 0]["second_face_score"][0]
    age = [calc_age(photo_taken[i], dob[i]) for i in range(len(dob))]

    return full_path, dob, gender, photo_taken, face_score, second_face_score, age

def load_data(mat_path):
    d = loadmat(mat_path)

    return d["image"], d["gender"][0], d["age"][0], d["db"][0], d["img_size"][0, 0], d["min_score"][0, 0]

def convert2txt(mat_path="imdb.mat",db="imdb"):
    lines=[]
    min_score=1.0
    full_path, dob, gender, photo_taken, face_score, second_face_score, age = get_meta(mat_path,db)
    genders=[0,0]
    ages=[]
    for i in range(101):
        ages.append(0)
    for i in tqdm(range(len(full_path))):
        #if face_score[i] < min_score:
            #continue
        #if (~np.isnan(second_face_score[i])) and second_face_score[i] > 0.0:
            #continue
        if ~(0 <= age[i] <= 100):
            continue
        if np.isnan(gender[i]):
            continue
        g=int(gender[i])
        genders[g]+=1
        ag=int(age[i])
        ages[ag]+=1
        #print(i,gender[i],age[i])
        line=full_path[i][0]+" "+str(g)+" "+str(ag)
        lines.append(line)
    with open("gt.txt","w")as f:
        for line in lines:
            f.write(line+"\n")
    print("genders",genders[0],genders[1])
    print("age:")
    for i in range(101):
        print(i,ages[i])
    plt.plot(np.linspace(0, 101,101),ages)
    plt.savefig("plot.png")
    plt.show()

if __name__=="__main__":
    convert2txt()

結果如下:

性別比(男:女)=188746:262834

年齡分佈:

畫成圖如下:

不難看出30-50歲之間的圖片最多，這也是主流的分佈。

具體到age-gender-estimation專案，可以簡單的通過

./download.sh

下載，然後使用

python3 create_db.py --output data/imdb_db.mat --db imdb --img_size 64

將資料集轉換為需要的格式，這個格式主要是清理無效標籤，省的每次都再重複做，程式碼和我上面給出的差不多，不再贅述。

模型

使用的模型為WiderResnet

通過Netron可視化出來是

可以看出是由6個殘差模型拼起來的，不過輸出部分有兩個輸出，一個是性別的2，另一個是年齡的101

訓練

訓練部分也比較簡單，生成了資料檔案後直接使用

python3 train.py --input data/imdb_db.mat

就可以了，如果還想使用資料增強，可以加上--aug

python3 train.py --input data/imdb_db.mat --aug

demo

想看訓練好的效果可以執行

python3 demo.py

人臉性別和年齡識別

資料

模型

訓練

demo

人臉性別和年齡識別

基於CNN的人臉性別、年齡識別

tf16: 臉部特徵識別性別和年齡

C++第十週【任務2】定義一個名為CPerson的類，有以下私有成員:姓名、身份證號、性別和年齡，成員函式：建構函式、解構函式、輸出資訊的函式。

建立一個學生類(Student)，包括學號成績，程式設計輸入和顯示學生的資訊。建立一個人類(Person)，包含姓名、性別和年齡，並作為學生類的基類

javascript 身份證驗證及自動設定性別和年齡

深度學習（十四）基於CNN的性別、年齡識別

人臉屬性分析--性別、年齡和表情識別

android opencv實現人臉檢測以及年齡和性別識別

C++開發人臉性別識別教程（3）——OpenCv配置和ImageWatch插件介紹

vggface2人臉識別資料集【論文筆記】VGGFace2——一個能夠用於識別不同姿態和年齡人臉的資料集

根據人臉預測年齡性別和情緒（python + keras）（三）

人臉屬性識別演算法 | 性別+種族+年齡+表情

C++開發人臉性別識別總結

C++開發人臉性別識別教程（8）——搭建MFC框架之讀取目錄信息

實時卷積神經網路實現人臉檢測和情感/性別分類

卷積神經網路, 識別人臉性別

SelectSearch+CNN人工智慧實現人臉檢測和識別圖文教程（附完整專案程式碼python語言）

利用MTCNN和facenet實現人臉檢測和人臉識別

5_人臉檢測和人臉識別綜述（調研）（20181211）

人臉性別和年齡識別

資料

模型

訓練

demo

相關推薦