1. 程式人生 > >深度學習筆記(十二)--深度學習資料集MNIST、ImageNet、 COCO 、 VOC介紹

深度學習筆記(十二)--深度學習資料集MNIST、ImageNet、 COCO 、 VOC介紹

1.  MNIST

深度學習領域的“Hello World!”,入門必備!MNIST是一個手寫數字資料庫,它有60000個訓練樣本集和10000個測試樣本集,每個樣本影象的寬高為28*28。此資料集是以二進位制儲存的,不能直接以影象格式檢視,不過很容易找到將其轉換成影象格式的工具。

  最早的深度卷積網路LeNet便是針對此資料集的,當前主流深度學習框架幾乎無一例外將MNIST資料集的處理作為介紹及入門第一教程,其中Tensorflow關於MNIST的教程非常詳細。資料集下載~12MB

2. ImageNet

ImageNet資料集有1400多萬幅圖片,涵蓋2萬多個類別。其中有超過百萬的圖片有明確的類別標註和影象中物體位置的標註,相關資訊如下:

    1)非空的同義詞集總數:21841 

    2)影象總數:14,197,122

    3)邊界框註釋的影象數:1,034,908

    4)具有SIFT特徵的同義詞集數:1000

    5)具有SIFT特徵的影象數:120萬

Imagenet資料集是目前深度學習影象領域應用得非常多的一個領域,關於影象分類、定位、檢測等研究工作大多基於此資料集展開。Imagenet資料集文件詳細,有專門的團隊維護,使用非常方便,在計算機視覺領域研究論文中應用非常廣,幾乎成為了目前深度學習影象領域演算法效能檢驗的“標準”資料集。資料集下載~1TB(ILSVRC2016比賽全部資料)

ImageNet是根據WordNet層次(目前只有名詞)組織的一個影象資料庫,其中每個節點的層次結構是由成千上萬的影象描繪。目前,有平均每個節點超過五百的影象。我們希望對於研究人員,教育工作者,學生和所有分享我們對圖片激情的人來說,ImageNet能成為一個有用的資源。

點選這裡瞭解更多關於ImageNet,請點選這裡加入ImageNet郵件列表。

3. COCO

    COCO(Common Objects in Context)是一個新的影象識別、分割、和字幕資料集,它有如下特點:

    1)物件分割
    2)上下文識別
    3)每個影象的多個物件
    4)超過300000幅影象
    5)超過200萬個例項
    6)80個物件類別
    7)每個影象5個說明文字
    8)100000人的關鍵點

   COCO資料集由微軟贊助,其對於影象的標註資訊不僅有類別、位置資訊,還有對影象的語義文字描述,COCO資料集的開源使得近兩三年來影象分割語義理解取得了巨大的進展,也幾乎成為了影象語義理解

演算法效能評價的“標準”資料集。資料集下載~40GB

4. PASCAL VOC

PASCAL VOC挑戰賽是視覺物件的分類識別和檢測的一個基準測試,提供了檢測演算法和學習效能的標準影象註釋資料集和標準的評估系統。PASCAL VOC圖片集包括20個目錄:人類;動物(鳥、貓、牛、狗、馬、羊);交通工具(飛機、自行車、船、公共汽車、小轎車、摩托車、火車);室內(瓶子、椅子、餐桌、盆栽植物、沙發、電視)。PASCAL VOC挑戰賽在2012年後便不再舉辦,但其資料集影象質量好,標註完備,非常適合用來測試演算法效能。資料集下載~2GB