1. 程式人生 > >資料集整理

資料集整理

轉:https://blog.csdn.net/liuxiao214/article/details/78889662

一共12個人體行為識別的資料集,基於視訊的;

6個影象識別的,有關物體識別、行人識別、年齡識別和人頭檢測的,基於影象,影象識別資料集參考於部落格:http://blog.csdn.net/qq_14845119/article/details/51913171

後續可能還會補充。


視訊識別


1、Weizmann

內容:

1、10個類別,每個類別9個視訊,背景單一。 
2、180x144

下載連結: http://www.wisdom.weizmann.ac.il/~vision/SpaceTimeActions.html


2、KTH

內容:

1、共25個人採集,6個類別,每個類別4個情境,3中室外,1種室內,共600個視訊。 
2、給出了每個視訊4個片段的始末幀位置。 
3、規格:160x120,25fps。

下載連結: http://www.nada.kth.se/cvap/actions/


3、Fire Detection

內容: 共6個視訊,火災檢測。

下載連結: http://crcv.ucf.edu/data/fire.php


4、UCF101

內容:

1、共13320個視訊101個類別,從YouTube採集的真實場景。 
2、分為5大類:人與物互動、baby動作、人人互動、樂器演奏、運動。 
3、規格:320x240,25fps,最小視訊為28幀。

下載連結: http://crcv.ucf.edu/data/UCF101.php


5、HMDB51

內容:

1、共51個類別,6849個視訊。每一個類別至少包含101個視訊。 
2、從電影、視訊網站上採集。 
3、包含5大類:面部動作(微笑、大笑、咀嚼、說話);面部與物互動動作(吃飯、喝水、抽菸);身體運動(翻跟斗、拍手、爬上等);身體與物互動運動(梳頭髮、拔劍等);人人互動運動(擊劍、擁抱、接吻等)

下載連結: http://serre-lab.clps.brown.edu/resource/hmdb-a-large-human-motion-database/#dataset


6、VISAL

內容:

1、包含很多資料集,船隻資料、紋理合成資料、交通擁擠資料、擁擠人群資料UCSD(行人、人註釋、人數、線劃分)、人3D姿態資料MADS。 
2、可下載擁擠人群和人姿態。

下載連結: http://visal.cs.cityu.edu.hk/downloads/


7、Monitoring Human Activity

內容:

1、資料量很小,且需要單獨下載,有空可下載。

下載連結: http://mha.cs.umn.edu/index.shtml


8、HOLLYWOOD2

內容:

1、人體動作:12個類別。 
2、場景:10個類別。 
3、共3669個視訊,20.1個小時。 
4、從69部電影中採集。 
5、視訊樣本中行為人的表情、姿態、穿著,以及相機運動、光照變化、遮擋、背景等變化很大,接近於真實場景下的情況,因而對於行為的分析識別極具挑戰性。

下載連結: http://www.di.ens.fr/~laptev/actions/hollywood2/


9、YouTube-8M

內容:

1、800萬個標註視訊,每個視訊120s到500s。

下載連結: https://research.google.com/youtube8m/


10、Moments in Time Dataset

內容:

1、100萬個標註視訊,每個視訊3秒。

下載連結: http://moments.csail.mit.edu/


11、TRECVID

內容:

如何下載,沒看明白,暫時先不管。

下載連結: http://www-nlpir.nist.gov/projects/tv2008/tv2008.html#1


12、CMU Graphics Lab Motion Capture Database

內容:

應該是一些骨骼點動作捕捉,下載連結分散,很難下載,需要寫指令碼。

下載連結: http://mocap.cs.cmu.edu/


影象識別


1、ImageNet

內容: 物體識別

ImageNet是一個計算機視覺系統識別專案,是目前世界上影象識別最大的資料庫。是美國斯坦福的電腦科學家李飛飛模擬人類的識別系統建立的。能夠從圖片識別物體。目前已經包含14197122張影象,是已知的最大的影象資料庫。

下載連結: http://www.image-net.org/


2、CIFAR

內容: 物體識別

CIFAR-100由60000張影象構成,包含100個類別,每個類別600張影象,其中500張用於訓練,100張用於測試。其中這100個類別又組成了20個大的類別,每個影象包含小類別和大類別兩個標籤。官網提供了Matlab,C,python三個版本的資料格式。

下載連結: http://www.cs.toronto.edu/~kriz/cifar.html


3、INRIA Person Dataset

內容: 行人檢測

Inria資料集是最常使用的行人檢測資料集。其中正樣本(行人)為png格式,負樣本為jpg格式。裡面的圖片分為只有車,只有人,有車有人,無車無人四個類別。圖片畫素為70*134,96*160,64*128等。

下載連結: http://pascal.inrialpes.fr/data/human/


4、CaltechPedestrian Detection Benchmark

內容: 行人識別

下載連結: http://www.vision.caltech.edu/Image_Datasets/CaltechPedestrians/


5、Adience

內容: 性別年齡識別

該資料集來源為Flickr相簿,由使用者使用iPhone5或者其它智慧手機裝置拍攝,同時具有相應的公眾許可。該資料集主要用於進行年齡和性別的未經過濾的面孔估計。同時,裡面還進行了相應的landmark的標註。是做性別年齡估計和人臉對齊的一個數據集。圖片包含2284個類別和26580張圖片。

下載連結: http://www.openu.ac.il/home/hassner/Adience/data.html#agegender


6、HollywoodHeads dataset

內容: 人頭檢測

該資料集為從視訊中擷取的圖片,包含224740張jpeg格式圖片,還有xml格式的標註,和VOC的標註方式一樣。

下載連結: http://www.di.ens.fr/willow/research/headdetection/release/HollywoodHeads.zip