1. 程式人生 > >Microsoft COCO: Common Objects in Context筆記

Microsoft COCO: Common Objects in Context筆記

MS COCO資料集分為三部分:介紹、資料集分類、展示

2014年版本(包含80個類的分割掩碼)的資料:20G左右的圖片和500M左右的標籤       標籤標記了每個segmentation的邊界精確位置 + bounding box的精確目標,其精度均為小數點後兩位。一個目標的annotation如下:

{"segmentation":[[392.87, 275.77, 402.24, 284.2, 382.54, 342.36, 375.99, 356.43, 372.23, 357.37, 372.23, 397.7, 383.48, 419.27,407.87, 439.91, 427.57, 389.25, 447.26, 346.11, 447.26, 328.29, 468.84, 290.77,472.59, 266.38], [429.44,465.23, 453.83, 473.67, 636.73, 474.61, 636.73, 392.07, 571.07, 364.88, 546.69,363.0]], "area": 28458.996150000003, "iscrowd": 0,"image_id": 503837, "bbox": [372.23, 266.38, 264.5,208.23], "category_id": 4, "id": 151109}, 

該資料集主要有的特點如下:(1)Object segmentation(2)Recognition in Context(3)Multiple objects per image(4)More than 300,000 images(5)More than 2 Million instances(6)80 object categories(7)5 captions per image(8)Keypoints on 100,000 people

微軟在ECCV Workshops裡發表的文章:Microsoft COCO: Common Objects in Context詳細的介紹了這個資料集。這個資料集以scene understanding為目標,從複雜的日常場景中擷取,影象中的目標通過精確的segmentation進行位置的標定。影象包括91類(2015版)目標,328,000影像和2,500,000個label。

COCO資料集分兩部分發布,前部分於2014年釋出,後部分於2015年,2014年版本:82,783 training, 40,504 validation, and 40,775 testing images,有270k的segmented people和886k的segmented object;2015年版本:165,482 train, 81,208 val, and 81,434 test images。