1. 程式人生 > >深度學習常用資料集資源(計算機視覺領域)

深度學習常用資料集資源(計算機視覺領域)

目錄

 

1、MNIST 

2、ImageNet 

4、COCO 

5、PASCAL VOC

6、FDDB


1、MNIST 

深度學習領域的入門資料集,當前主流的深度學習框架幾乎都將MNIST資料集的處理入門第一教程。MNIST是一個手寫數字資料庫,它有60000個訓練樣本集和10000個測試樣本集,每個樣本影象的寬高為28*28,數字放在一個歸一化的、固定尺寸的圖片的中心。

資料集大小:~12MB

下載地址:http://yann.lecun.com/exdb/mnist/index.html

2、ImageNet 

Imagenet資料集是目前深度學習影象領域應用得非常多的一個領域,關於影象分類、定位、檢測等研究工作大多基於此資料集展開。Imagenet資料集文件詳細,有專門的團隊維護,使用非常方便,在計算機視覺領域研究論文中應用非常廣,幾乎成為了目前深度學習影象領域演算法效能檢驗的“標準”資料集。

Imagenet資料集有1400多萬幅圖片,涵蓋2萬多個類別;其中有超過百萬的圖片有明確的類別標註和影象中物體位置的標註。

資料集大小:~1TB

下載地址:http://www.image-net.org/about-stats

CIFAR-10包含10個類別,50,000個訓練影象,彩色影象大小:32x32,10,000個測試影象。CIFAR-100則是包含100個類,每類有600張圖片,其中500張用於訓練,100張用於測試;這100個類分組成20個超類。影象類別均有明確標註。CIFAR對於影象分類演算法測試來說是一個非常不錯的中小規模資料集,雖然用得人比以前少了很多,但仍然能用它做有趣的合理性測試。

資料集大小:~170MB

下載地址:http://www.cs.toronto.edu/~kriz/cifar.html

4、COCO 

 

COCO資料集由微軟贊助,其對於影象的標註資訊不僅有類別、位置資訊,還有對影象的語義文字描述,COCO資料集的開源使得近兩三年來影象分割語義理解取得了巨大的進展,也幾乎成為了影象語義理解演算法效能評價的“標準”資料集。

資料集大小:~40GB

下載地址:http://mscoco.org/ 

5、PASCAL VOC

 

PASCAL VOC圖片集包括20個目錄:人類;動物(鳥、貓、牛、狗、馬、羊);交通工具(飛機、自行車、船、公共汽車、小轎車、摩托車、火車);室內(瓶子、椅子、餐桌、盆栽植物、沙發、電視)。PASCAL VOC挑戰賽是視覺物件的分類識別和檢測的一個基準測試,提供了檢測演算法和學習效能的標準影象註釋資料集和標準的評估系統。

資料集大小:~2GB

下載地址:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/index.html

6、FDDB

 

FDDB是全世界最具權威的人臉檢測評測平臺之一,包含2845張圖片,共有5171個人臉作為測試集。測試集範圍包括:不同姿勢、不同解析度、旋轉和遮擋等圖片,同時包括灰度圖和彩色圖,標準的人臉標註區域為橢圓形。該資料集的圖片來自於美聯社和路透社新聞報道圖片,並刪除了重複圖片。

資料集大小:~550MB

下載地址:http://vis-www.cs.umass.edu/fddb/