視訊分類資料集介紹
視訊分類資料集
在視訊分類專案中,有很多經典的公開資料集,目前主要的資料集如列表所示:
重點介紹三個中等規模的資料集。
1. UCF101
動作識別資料集,從youtube收集而得,共包含101類動作。其中每類動作由25個人做動作,每人做4-7組,共13320個視訊,解析度為320*240,共6.5G。
UCF101在動作的採集上具有非常大的多樣性,包括相機執行、外觀變化、姿態變化、物體比例變化、背景變化、光纖變化等。
101類動作可以分為5類:人與物體互動、人體動作、人與人互動、樂器演奏、體育運動。
參考文件:http://crcv.ucf.edu/papers/UCF101_CRCV-TR-12-01.pdf
每類動作視訊數量:
下載網址:http://crcv.ucf.edu/data/UCF101/UCF101.rar
2. HMDB
HMDB51包含51類動作,共有6849個視訊,每個動作至少包含51個視訊,解析度320*240,。來自於YouTube,google視訊等,共2G.
動作主要包括:
1) 一般面部動作微笑,大笑,咀嚼,交談。
2) 面部操作與物件操作:吸菸,吃,喝。
3) 一般的身體動作:側手翻,拍手,爬,爬樓梯,跳,落在地板上,反手翻轉、倒立、跳、拉、推、跑,坐下來,坐起來,翻跟頭,站起來,轉身,走,波。
4) 與物件互動動作:梳頭,抓,抽出寶劍,運球、高爾夫、打東西,球、挑、倒、推東西,騎自行車,騎馬,射球,射弓、槍、擺棒球棍、劍鍛鍊,扔。
5) 人體動作:擊劍,擁抱,踢某人,親吻,拳打,握手,劍戰。
下載:http://serre-lab.clps.brown.edu/resource/hmdb-a-large-human-motion-database/#Downloads
3.Kinetics
Kinetics-600是一個大規模,高質量的YouTube視訊網址資料集,其中包含各種人的動作。 還有一個2017年釋出的初始資料集,現在稱為Kinetics-400。
該資料集由大約500,000個視訊組成,涵蓋600個人類動作,每個動作至少有600個視訊。 每個視訊持續大約10秒鐘,並標有一個類。 這些動作涵蓋了廣泛的範圍,包括人 - 物體互動,如演奏樂器,以及人與人之間的互動,如握手和擁抱。
下載:https://deepmind.com/research/open-source/open-source-datasets/kinetics/
或者https://github.com/activitynet/ActivityNet/blob/master/Crawler/Kinetics/README.md