1. 程式人生 > >論文分析--《基於深度學習的人臉表情識別演算法研究_宋新慧》

論文分析--《基於深度學習的人臉表情識別演算法研究_宋新慧》

1.摘要:

文章中提出的演算法:

1)針對靜態的影象:細節感知遷移網路

      資料集:CK+;Kaggle

2)針對視訊序列:利用多工學習的遞迴神經網路

      資料集:I-PFE

2.本文工作:

1)基於細節感知遷移網路的人臉表情識別:

傳統特徵提取方法存在的問題:光照、角度等影響

解決問題的方法:對抗網路(擴充資料集)+細節感知遷移網路(卷積神經網路)

2)基於視訊序列的多工遞迴神經網路結構:

編碼網路+時間遞迴神經網路+人臉身份識別網路+人臉表情識別網路

3.綜述:

1)基於深度學習的人臉檢測方法:

R-CNN:

SPP-Net : 解決輸入影象大小固定的問題

Fast R-CNN : 解決所有候選區都要輸入網路模型的問題

FacenessNet :專門用於人臉檢測

2)人臉對齊方法:

基於模型的人臉對齊方法:ASM  AAM

基於線性迴歸的人臉對齊方法:

基於非線性迴歸的人臉對齊方法:

3)人臉表情特徵提取方法:

Haar特徵:

LBP特徵:區域性二進位制模板

4)人臉表情識別方法:

針對影象中的靜態人臉表情識別:Bayes分類演算法、SVM、AdaBoost、基於CNN分類演算法

針對動態視訊中的動態人臉表情識別:HMM(隱馬爾可夫)模型

基於深度學習的人臉表情識別方法:

4.基於細節感知遷移網路的人臉表情識別方法:

1)人臉表情資料集:

CK+:123個物件的327個被標記的表情圖片序列、七種表情

Kaggle:28709張訓練樣本、3859張驗證資料集、3859張測試樣本、七種表情

2)基於對抗網路的資料集擴充:

基本思想:生成的資料與樣本資料儘量相似

D:輸出相似概率,越高越好   G:輸出生成資料與樣本的差異,越小越好

G網路:

           100維噪聲--->卷積--->反捲積(ReLU啟用函式)--->64*64影象

            反捲積:2*2--->4*4 特徵對映

D網路:

            每層用LeakyReLU啟用函式

3)細節感知遷移網路結構:



Batch Normalization(批規範化):歸一化啟用操作前的輸入值

殘差網路:解決網路深度加深而準確度降低的問題

Dropout:一種歸一化技術,隨機丟掉一些隱藏節點,減少不同節點之間的相互作用

4)網路學習:

計算梯度(用來執行引數更新)的方法:SGD、AdaGrad、Adam

5)基於多網路融合的人臉表情識別:

基於區域融合的人臉表情識別:三個區域,SVM分類

基於提升的人臉表情識別:三個級聯的網路結構(兩層俊基神經網路,第三個為DPTL網路)

6)實驗結果:

基於細節感知遷移網路的實驗結果:


基於網路融合和網路提升的實驗結果:


5.基於視訊序列的多工遞迴神經網路人臉表情識別:

1)遞迴神經網路(RNN)