1. 程式人生 > >視訊分類資料集介紹

視訊分類資料集介紹

視訊分類資料集

 

在視訊分類專案中,有很多經典的公開資料集,目前主要的資料集如列表所示:

 

重點介紹三個中等規模的資料集。

1. UCF101

動作識別資料集,從youtube收集而得,共包含101類動作。其中每類動作由25個人做動作,每人做4-7組,共13320個視訊,解析度為320*240,共6.5G。

UCF101在動作的採集上具有非常大的多樣性,包括相機執行、外觀變化、姿態變化、物體比例變化、背景變化、光纖變化等。

101類動作可以分為5類:人與物體互動、人體動作、人與人互動、樂器演奏、體育運動。

參考文件:http://crcv.ucf.edu/papers/UCF101_CRCV-TR-12-01.pdf

每類動作視訊數量:

下載網址:http://crcv.ucf.edu/data/UCF101/UCF101.rar

 

 

2. HMDB

HMDB51包含51類動作,共有6849個視訊,每個動作至少包含51個視訊,解析度320*240,。來自於YouTube,google視訊等,共2G.

動作主要包括:

1) 一般面部動作微笑,大笑,咀嚼,交談。

2) 面部操作與物件操作:吸菸,吃,喝。

3) 一般的身體動作:側手翻,拍手,爬,爬樓梯,跳,落在地板上,反手翻轉、倒立、跳、拉、推、跑,坐下來,坐起來,翻跟頭,站起來,轉身,走,波。

4) 與物件互動動作:梳頭,抓,抽出寶劍,運球、高爾夫、打東西,球、挑、倒、推東西,騎自行車,騎馬,射球,射弓、槍、擺棒球棍、劍鍛鍊,扔。

5) 人體動作:擊劍,擁抱,踢某人,親吻,拳打,握手,劍戰。

 

 

下載:http://serre-lab.clps.brown.edu/resource/hmdb-a-large-human-motion-database/#Downloads

 

3.Kinetics

Kinetics-600是一個大規模,高質量的YouTube視訊網址資料集,其中包含各種人的動作。 還有一個2017年釋出的初始資料集,現在稱為Kinetics-400。
該資料集由大約500,000個視訊組成,涵蓋600個人類動作,每個動作至少有600個視訊。 每個視訊持續大約10秒鐘,並標有一個類。 這些動作涵蓋了廣泛的範圍,包括人 - 物體互動,如演奏樂器,以及人與人之間的互動,如握手和擁抱。

下載:https://deepmind.com/research/open-source/open-source-datasets/kinetics/

或者https://github.com/activitynet/ActivityNet/blob/master/Crawler/Kinetics/README.md