python計算機視覺深度學習工具4影象分類資料集(機器學習常用資料集)
MNIST

圖片.png
此資料集是正確分類手寫數字,0-9。
MNIST(NIST:National Institute of Standards and Technology,M為modified), 資料經過預處理,以減輕計算機視覺的處理負擔,該資料集專注於數字識別。訓練集 (training set) 由來自 250 個不同人手寫的數字構成, 其中 50% 是高中學生, 50% 來自人口普查局 (the Census Bureau) 的工作人員.
此資料集是正確分類手寫數字0-9。在許多情況下它是機器學習演算法排名的標準。Geoffrey Hinton將資料集描述為"the drosophila of machine learning"。
MNIST本身包含60,000個訓練影象和10,000個測試影象。每個特徵向量是784-dim,對應於影象的28×28灰度畫素強度。這些灰度畫素強度是無符號整數,落在[0,255]範圍內。
Animals:狗,貓和熊貓

image.png
每種動物1000張,共有3000張圖片。可以在我們的CPU或GPU上快速訓練深度學習模型並獲得合理的準確性。
CIFAR-10

image.png
CIFAR-10由60,000 32 32 3 (RGB)影象組成。
CIFAR-10由10類組成,包括:飛機,汽車,鳥,貓,鹿,狗,青蛙,馬,船和卡車。
雖然很容易訓練在MNIST上獲得> 97%分類精度的模型,但在CIFAR-10(以及更大集CIFAR-100)很難獲得這樣的模型。
挑戰來自於物體出現方式的巨大差異。
參考: https://www.cs.toronto.edu/~kriz/cifar.html
SMILES

image.png
SMILES資料集由面部影象組成,這些影象要麼是微笑的,要麼是不笑的,資料集中有13,165個灰度影象,每個影象大小64*64。資料集中的影象被緊緊地裁剪在臉部周圍,允許我們設計機器學習演算法專注於微笑識別。
Kaggle:Dogs vs. Cats
Dogs vs. Cats挑戰是Kaggle比賽的一部分,旨在設計學習演算法正確地將影象分類為包含狗或貓。共提供了25,000張圖片
使用不同的影象解析度。

image.png
參考: https://www.kaggle.com/c/dogs-vs-cats/data
Flowers-17

image.png
Flowers-17資料集是17類別的資料集,每個類別有80個影象,由Nilsback等人策劃。
Flowers-17為具有挑戰性的資料集,因為規模大,視角,背景負責,變化的光照條件和類內變化。
參考: http://www.robots.ox.ac.uk/~vgg/data/flowers/17/