1. 程式人生 > >《TensorFlow:實戰Google深度學習框架》——6.1 影象識別中經典資料集介紹

《TensorFlow:實戰Google深度學習框架》——6.1 影象識別中經典資料集介紹

1、CIFAR資料集

CIFAR是一個影響力很大的影象分類資料集,CIFAR資料集中的圖片為32*32的彩色圖片,由Alex  Krizhevsky教授、Vinod Nair博士和Geoffrey Hinton教授整理的。

CIFAR是影象詞典專案(Visual Dictionary)中800萬張圖片的一個子集。CIFAR資料集分為CIFAR-10CIFAR-100兩個問題。

CIFAR-10問題收集了10個不同種類的60000張圖片,每張圖片僅包含一個種類的實體,每個類有6000個影象。有50000個訓練影象和10000個測試影象。訓練影象分為5個訓練批次,每個批次包含100000萬影象。下圖顯示了CIFAR-10資料集中的每一個種類的一些樣例圖片以及這些種類的類別名稱。CIFAR官網

https: //www.cs.toronto.edu/~kriz/cifar.html提供不同格式的CIFAR資料集下載。
 

CIFAR-100收集了100個類,每個類包含600個影象。每類各有500個訓練影象和100個測試影象。CIFAR-100中的100個類被分成20個超類。每個影象都有一個所屬類的名稱所屬超類的名稱


2、ImageNet資料集

ImageNet資料集是由斯坦福大學李飛飛教授帶頭整理的資料集。

ImageNet是基於WordNet的大型影象資料庫。將近1500萬圖片被關聯到了WordNet的大約20000個名詞同義詞集上。每一個與ImageNet相關的WordNet同義詞集都代表了現實世界中的一個實體,是分類問題中的一個類別。ImageNet中的圖片是從網際網路上爬取下來的,並且通過亞馬遜的人工標註服務將圖片分類到WordNet的同義詞集上。

ImageNet的每一個圖片可能會包含多個實體,這是和CIFAR資料集的區別,下圖展示了ImageNet中的一張圖片,圖片中用幾個矩形框出了不同實體的輪廓,在影象識別問題中,一般將用於框出實體的矩形成為bounding box。

ImageNet2012目前是使用比較多的資料集,包含了1000個類別的120萬張圖片,每張圖片只屬於一個類別