Ordinal Regression with Multiple Output CNN for Age Estimation

阿新 • • 發佈：2018-11-06

文獻提出了結合CNN和迴歸進行年齡預測的端到端的深度學習網路,網路結構圖如下,

這裡寫圖片描述

輸入為 $60\times60\times3$ 的影象,網路的前三層為三個卷積層,前兩個卷積層為convolution+relu+batchnorm+pooling,第三個卷積層為convolution+relu+batchnorm結構,卷積層之後是兩個全連線層,第一個FC的輸出通道為80,由於年齡預測為100個類別(1到100),因此第二個FC的輸出通道為200,每兩個輸出作為一個二分類器.例如對於訓練資料形式為 $D={x_i, y_i^k}_{i=1}^N$

xi $x_i$ 為輸入影象,

yi $y_i$ 為對應的標籤,對於第k個二值分類問題,訓練資料為

D=xi,yki,wkiNi=1 $D={x_i, y_i^k, w_i^k}_{i=1}^N$ ,其中標籤

yki∈0,1 $y_i^k\in {0,1}$ 為年齡類別標籤,將年齡的分類轉換為100個子問題,即預測該樣本的否大於

i∈1,2,3,...,100 $i \in {1, 2, 3, ..., 100}$ 歲,如果大於,則該子問題的分類器輸出標籤為1,否則為0,

這裡寫圖片描述

最後根據所有的100個子問題的輸出結果計算預測年齡，其計算公式為：

$predict_{age} = 1 + \sum_{k=1}^{K-1}{f}_{k}(x^,)$

損失函式的計算

採用交叉損失熵,對於每個類別,賦予不同的權重 $w_i^k$ ,

$E_s = -\frac{1}{N}\sum_{i=1}^{N}(1{o_i = y_i}w_ilog(p(o_i|x_i, W))$

我們有K=100個子任務，所以我們最後的損失函式公式為 $E_m = -\frac{1}{N}\sum_{i=1}^{N}\sum_{t=1}^{T}(\lambda^t1{o_i^t = y_i^t}w_i^tlog(p(o_i^t|x_i, W^t)))$
其中 $\lambda^t$ 代表著第t個子任務的資料權重，也就是每個年齡資料量在總資料量中的比重，其計算公式為 $\lambda^t = \frac{\sqrt{N_t}}{\sum_{i=1}^{T}{\sqrt{N_i}}}$ 而$
w_i$表示每一個二分類子問題中每一個類別的權重，可以簡單地設為1。最後再利用反向梯度傳播來實現引數最優化。

程式碼分析

文章提供了caffe程式碼,

輸入為HDF5資料格式,

layer {
    top: "data"
    type: "HDF5Data"
    top: "label"
    name: "data"
    hdf5_data_param {
        source: "../data/SourceDataForCaffe/normal_Tutu_morph_wiki/hdf5_data_gray/train.txt"
        batch_size: 256
    }
    include {
        phase: TRAIN
    }
}
layer {
    top: "data"
    top: "label"
    name: "data"
    type: "HDF5Data"

    hdf5_data_param {
        source: "../data/SourceDataForCaffe/normal_Tutu_morph_wiki/hdf5_data_gray/test.txt"
        batch_size: 256
    }
    include {
        phase: TEST
    }
}

對於hdf5資料的轉換,可以參考程式碼,

import sys
import numpy as np
import matplotlib.pyplot as plt
import h5py

IMAGE_SIZE = (60, 60)
MEAN_VALUE = 128

filename = sys.argv[1]
setname, ext = filename.split('.')

with open(filename, 'r') as f:
    lines = f.readlines()

np.random.shuffle(lines)

sample_size = len(lines)
imgs = np.zeros((sample_size, 1,) + IMAGE_SIZE, dtype=np.float32)
freqs = np.zeros((sample_size, 2), dtype=np.float32)

h5_filename = '{}.h5'.format(setname)
with h5py.File(h5_filename, 'w') as h:
    for i, line in enumerate(lines):
        image_name, fx, fy = line[:-1].split()
        img = plt.imread(image_name)[:, :, 0].astype(np.float32)
        img = img.reshape((1, )+img.shape)
        img -= MEAN_VALUE
        imgs[i] = img
        freqs[i] = [float(fx), float(fy)]
        if (i+1) % 1000 == 0:
            print('Processed {} images!'.format(i+1))
    h.create_dataset('data', data=imgs)
    h.create_dataset('freq', data=freqs)

with open('{}_h5.txt'.format(setname), 'w') as f:
    f.write(h5_filename)

之後是卷積和FC層,最後是損失函式層,

layer {
    bottom: "fc_output"
    bottom: "label"
    top: "loss"
    name: "loss"
    type: "OrdinalRegressionLoss"
    include { 
        phase: TRAIN 
    }
    ordinal_regression_loss_param {
        weight_file: "../data/weight_file/weight_file_normal.txt"
    }
} 
layer {
    bottom: "fc_output"
    bottom: "label"
    top: "loss"
    name: "loss"
    type: "OrdinalRegressionLoss"
    include { 
        phase: TEST
    }
    ordinal_regression_loss_param {
        weight_file: "../data/weight_file/weight_file_normal.txt"
    }
}

由於caffe沒有多工訓練的損失函式,因此作者編寫了對於的層,需要重新編譯caffe,可以參考,

https://github.com/kongsicong/Age_recognition_OR/tree/master/OrdinalRegression

處理後便可以訓練.

tensorflow模型訓練

編寫對應的tensorflow模型,訓練lmdb年齡分類資料,測試精度為,

平均年齡誤差:8.

github參考程式碼:https://github.com/kongsicong/Age_recognition_OR

Ordinal Regression with Multiple Output CNN for Age Estimation

文獻提出了結合CNN和迴歸進行年齡預測的端到端的深度學習網路,網路結構圖如下, 輸入為 60×60×3 60\times60\times3的影象,網路的前三層為三個卷積層,前兩個卷積層為convolution+relu+batchnorm+pooling,

SSR-Net: A Compact Soft Stagewise Regression Network for Age Estimation

逐級迴歸的年齡估計本文是國立臺灣大學發表的一篇依據人臉圖片進行年齡估計的文章.受DEX論文的啟發，這篇文章也把迴歸問題轉換為多個分類問題.SSR-Net採用了由粗到細多級分類的方式.每個stage僅對其之前的預測做出更精細的判斷.因此，對於神經元個數的需要就大大減少，這樣模型的體積也就下來了.

Lesson2 Liner Regression with multiple variables(多變數的線性迴歸)

Multiple Features（多特徵）是指訓練集中第i個訓練樣本的第j個特徵(標量)；是訓練集中第i個輸入特徵(向量)。 Example: Hypothesis: 以前：現在

CS229機器學習個人筆記（2）——Linear Regression with Multiple Variables

1.Multiple Features 目前，我們只討論了單特徵的迴歸模型，現在來增加一些特徵。增添更多特徵後，我們引入一系列新的註釋： n n —— 代表特徵的數量。 x(i) x^{(i)}代表第 i 個訓練例項，是

Linear Regression with multiple variables（多元變數的線性迴歸問題）

前言這一章還是緊接上一章的內容，在上一章，我們詳細地討論了關於一個變數的線性迴歸問題，而在我們的實際問題中，一般都不止一個變數，就比如上一章討論的預測房價問題，房價不僅只跟房子的大小有關，還跟它有幾間房間，幾層樓等等有關，所以我們需要涉及到的是多元變數的問題，在這

Stanford公開課機器學習---week2-1.多變數線性迴歸（Linear Regression with multiple variable）

3.多變數線性迴歸（Linear Regression with multiple variable） 3.1 多維特徵(Multiple Features) n 代表特徵的數量 x(i)代表第 i 個訓練例項,是特徵矩陣中的第 i 行,是一個向

吳恩達機器學習筆記8-多變量線性回歸(Linear Regression with Multiple Variables)--多維特征

學習筆記機器增加都是維度能夠因此表示轉置　　我們探討了單變量/特征的回歸模型，現在我們對房價模型增加更多的特征，例如房間數樓層等，構成一個含有多個變量的模型，模型中的特征為(??1, ??1, . . . , ????)。　　增添更多特征後，我們引入一

A Light CNN for Deep Face Representation with Noisy Labels

清晰深度 html spa sca 數據由於圖像測試數據承接上一篇博客。該論文思路清晰，實驗充分，這裏大致寫一些比較不錯的idea。從標題就能看出本文的主要貢獻：輕量、魯棒。利用一個輕量CNN從大規模數據且含大量噪聲中來學習一個深度面部表征。直接談談貢獻：本

論文筆記（2）--（Re-ID） Learning Discriminative Features with Multiple Granularities for Person Re-Id

https://github.com/lwplw/re-id_mgn 本文的主要思想就是通過區域分割，來獲得不同粒度的特徵，比如全域性和區域性特徵以及更細粒度的區域性特徵，通過一個網路的不同分支得到這些特徵，每個分支都對不同的分割塊進行特徵提取。論文提出通過融合行人的全域性資

Error:Execution failed for task ':app:processDebugManifest'. > Manifest merger failed with multiple

第一次遇到這個錯誤的時候我也有點兒蒙，仔細看一看error日誌， Error:Execution failed for task ':app:processDebugManifest'.> M

Ng第二課：單變量線性回歸(Linear Regression with One Variable)

dll oba vcf 更多 dba cfq dpf gis avd 二、單變量線性回歸(Linear Regression with One Variable) 2.1 模型表示 2.2 代價函數 2.3 代價函數的直觀理解 2.4 梯度下降

Kaldi + CNN for Speech Enhancement

speech ace out input conv2 str lte 初始化 color （一）網絡結構 input-> C1 –>softmax –>S2 –> C3 –>softmax –>S4 –>FC5 –> sof

【轉】論文閱讀（Chenyi Chen——【ACCV2016】R-CNN for Small Object Detection）

數據大小 table 使用 con 改進包括 end 修改 Chenyi Chen——【ACCV2016】R-CNN for Small Object Detection 目錄作者和相關鏈接方法概括創新點和貢獻方法細節實驗結果總結與收獲點參考文獻

SVN提交時報錯：Commit blocked by pre-commit hook (exit code 1) with no output.

code min commit asi tail log 提交解決 case 可能的原因：提交代碼的SVN命令中，Comment長度短了。參考：http://tortoisesvn.net/docs/nightly/TortoiseSVN_en/tsvn-howto-

linear regression and logistic regression with pytorch

write tex rom array類 var form cit basic ons import torch import torch.nn.functional as F from torch.autograd import variable x = Variable

Linear Regression with Scikit Learn

ext ins contains jpg ini with thead not tell Before you read ?This is a demo or practice about how to use Simple-Linear-Regression in sci

CNN for NLP（2）

ply elb HA del cnblogs model lan 建模 git 參考鏈接：卷積神經網絡(CNN)在句子建模上的應用，卷積神經網絡CNN在自然語言處理中的應用， CNN在NLP中的應用。CNN for NLP（2）

Manifest merger failed with multiple errors, see logs -- Android Studio問題匯總

存在 clas andro 作用 alt tar strong AR multipl FAQ:> Manifest merger failed with multiple errors, see logs 解決：此問題產生原因大概有三個 # 第一,清單文件

ML:單變量線性回歸（Linear Regression With One Variable）

one mod gre line lin 我們目的技術 ESS 模型表達（model regression）用於描述回歸問題的標記 m 訓練集（training set）中實例的數量 x 特征/輸入變量 y 目標變量/輸出變量 (x,y) 訓練集中的實例 (x(

linux系統post-commit hook failed (exit code 255) with no output的終極解決辦法

修改你的指令碼檔案把你以前的都內容都註釋掉，換成我下面的試試就知道行不行了【注意：】自己記得把專案目錄/var/www/html改為自己實際情況的 #!/bin/sh REPOS="$1" REV="$2" export LANG=en_US.UTF-8 SVN_PATH=/

Ordinal Regression with Multiple Output CNN for Age Estimation

損失函式的計算

程式碼分析

tensorflow模型訓練

相關推薦