1. 程式人生 > >人臉表情識別常用的幾個資料庫

人臉表情識別常用的幾個資料庫

人臉表情識別就是讓計算機識別人臉的各種表情,進而分析表情所代表的情緒,意圖等。人臉表情識別可以用在測謊,醫學輔助診斷,人機互動方面。 與人臉識別相比,人臉表情特徵更加細微,而且受各種因素的干擾也更大。目前人臉表情識別的研究都是在資料庫上做測試。下面介紹幾個比較常見的資料庫。

1: The Japanese Female FacialExpression (JAFFE) Database

這個資料庫比較小,而且是一個比較老的資料庫了,早在1998年就釋出了。該資料庫是由10位日本女性在實驗環境下根據指示做出各種表情,再由照相機拍攝獲取的人臉表情影象。整個資料庫一共有213張影象,10個人,全部都是女性,每個人做出7種表情,這7種表情分別是: sad, happy, angry, disgust,surprise, fear, neutral. 每個人為一組,每一組都含有7種表情,每種表情大概有3,4張樣圖。這樣每組大概20張樣圖,目前在這個資料庫上的識別率已經很高了,不管是person independent 或者是person dependent。識別率都很高。這個資料庫可以用來熟悉人臉表情識別的一些基礎知識,包括特徵提取,分類等。

2: The Extended Cohn-Kanade Dataset(CK+)

這個資料庫是在 Cohn-Kanade Dataset 的基礎上擴充套件來的,釋出於2010年。這個資料庫比起JAFFE 要大的多。而且也可以免費獲取,包含表情的label和Action Units 的label。

這個資料庫包括123個subjects, 593 個 image sequence,每個image sequence的最後一張 Frame 都有action units 的label,而在這593個image sequence中,有327個sequence 有 emotion的 label。這個資料庫是人臉表情識別中比較流行的一個數據庫,很多文章都會用到這個資料做測試。具體介紹可以參考如下文獻:

P.Lucey, J. F. Cohn, T.Kanade, J. Saragih, Z. Ambadar, and I. Matthews, "TheExtended Cohn-KanadeDataset (CK+)_ A complete dataset for action unit andemotion-specifiedexpression," inComputer Vision andPattern RecognitionWorkshops (CVPRW), 2010 IEEE Computer Society Conference on,2010, pp. 94-101.

3: GEMEP-FERA 2011

這個資料是2011年,IEEE 的 Automatic Face & GestureRecognition and Workshops (FG 2011), 2011 IEEE International Conference on 上提供的一個數據庫,如果要獲取這個資料庫,需要簽署一個assignment,而且只有學術界可以免費使用。

這個資料庫擁有的表情圖很多,但是subjects 很少。具體介紹可以參考如下文獻:

M.F. Valstar, M. Mehu, B.Jiang, M. Pantic, and K. Scherer, "Meta-Analysis ofthe First FacialExpression Recognition Challenge,"Systems,Man, andCybernetics, Part B: Cybernetics, IEEE Transactions on, vol. 42,pp. 966-979,2012.

4: AFEW_4_0_EmotiW_2014

這個資料庫用作ACM 2014 ICMI TheSecond Emotion Recognition In The Wild Challenge and Workshop。去年已經進行了第一屆的競賽,這個資料庫提供原始的video clips, 都擷取自一些電影,這些clips 都有明顯的表情,這個資料庫與前面的資料庫的不同之處在於,這些表情影象是 in the wild, not inthe lab. 所以一個比較困難的地方在於人臉的檢測與提取。詳細資訊可以參考如下文獻:

A.Dhall, R. Goecke, J. Joshi,M. Wagner, and T. Gedeon, "Emotion RecognitionIn The Wild Challenge2013," inProceedings of the 15thACM on Internationalconference on multimodal interaction, 2013, pp.509-516.

5:  GENKI-4K

這個資料庫專門用於做笑臉識別的,整個資料庫一共有4000張圖片,分為“笑”和“不笑”兩種,圖片中的人臉並不是posed,而是spontaneous的,每個圖片的人臉的尺度大小也不一樣,而且還有姿勢,光照的變化,以及頭的轉動,相對於posed facialexpression, 這個資料庫的難度要更大。

詳細資訊可以參考如下文獻:

WhitehillJ, Littlewort G, Fasel I, et al. Toward practical smile detection[J]. PatternAnalysis and Machine Intelligence, IEEE Transactions on, 2009, 31(11):2106-2111.

6:The UNBC-McMaster shoulder painexpression archive database

這個資料庫用於做pain的表情識別,目前釋出的資料庫包含25個subject,200個video sequences,每個video sequence的長度不一,從幾十幀圖到幾百幀圖,每張圖都有66 個facial landmarks,pain的intensity (0-15),以及facial action units的編號,每個video sequence也有一個整體pain的 OPI。

詳細資訊可以參考如下文獻:

Lucy,P., Cohn, J. F., Prkachin, K. M., Solomon, P., & Matthrews, I. (2011).Painful data: The UNBC-McMaster Shoulder Pain Expression Archive Database. IEEEInternational Conference on Automatic Face and Gesture Recognition (FG2011).

7:Bimodal Face and Body GestureDatabase (FABO)

這個資料庫與其它資料庫相比,多了gesture的資訊,目前利用multimodality 做情感計算的嘗試取得很多進展,利用語音資訊,人臉表情,body language等做emotion analysis正在受到越來越多的關注,這個資料庫就是從facial expression與body gesture兩個方面考慮人的情感,不過這個資料庫的ground truth label 很繁瑣,具體的資訊可以參考:

GunesH, Piccardi M. A bimodal face and body gesture database for automatic analysisof human nonverbal affective behavior[C]//Pattern Recognition, 2006. ICPR 2006.18th International Conference on. IEEE, 2006, 1: 1148-1153.