機器學習資料集 Dataset 彙總
分享一下我老師大神的人工智慧教程!零基礎,通俗易懂!http://blog.csdn.net/jiangjunshow
也歡迎大家轉載本篇文章。分享知識,造福人民,實現我們中華民族偉大復興!
1. CIFAR-10 & CIFAR-100
CIFAR-10包含10個類別,50,000個訓練影象,彩色影象大小:32x32,10,000個測試影象。
(類別:airplane,automobile, bird, cat, deer, dog, frog, horse, ship, truck)
(作者:Alex Krizhevsky, Vinod Nair, and Geoffrey Hinton)
(資料格式:Python版本、Matlab版本、二進位制版本<for C程式>)
CIFAR-100與CIFAR-10類似,包含100個類,每類有600張圖片,其中500張用於訓練,100張用於測試;這100個類分組成20個超類。每個影象有一個"find" label和一個"coarse"label。
2. 影象分類結果及對應的論文
影象分類結果及應的論文,包含資料集:MNIST、CIFAR-10、CIFAR-100、STL-10、SVHN、ILSVRC2012 task 1
ILSVRC: ImageNet Large Scale Visual Recognition Challenge
3. ImageNet
ImageNet相關資訊如下:
1)Total number of non-empty synsets: 21841
2)Total number of images: 14,197,122
3)Number of images with bounding box annotations: 1,034,908
4)
5)Number of images with SIFT features: 1.2 million
4. COCO
COCO(Common Objects in Context)是一個新的影象識別、分割、和字幕資料集,它有如下特點:
1)Object segmentation
2)Recognition in Context
3)Multiple objects per image
4)More than 300,000 images
5)More than 2 Million instances
6)80 object categories
7)5 captions per image
8)Keypoints on 100,000 people
COCO 2016 Detection Challenge(2016.6.1-2016.9.9)和COCO 2016 Keypoint Challenge(2016.6.1-2016.9.9)已經由Microsoft發起 由ECCV 2016(ECCV:European Conference On Computer Vision )。
4. 3D資料
3)Human3.6M (3D Human Pose Dataset)
- 《Iterated Second-Order Label Sensitive Pooling for 3D Human Pose Estimation》
5. 人臉Dataset
1)LFW (Labeled Faces in the Wild)
6. Stereo Datasets
3)KITTI Vision Benchmark Suite
7. 普林斯頓大學人工智慧自動駕駛汽車專案