1. 程式人生 > >COCO資料集擴充套件的幾個關鍵點

COCO資料集擴充套件的幾個關鍵點

http://mscoco.org/資料集,我們需要擴充套件現有category型別,分割標註過程過耗時耗力,而且對於最終生成的json檔案的物件“segmentation”,我們首先需要區分我們使用的是COCO“things”還是COCO“stuff”。

1) COCO things的segmentation,該物件現有的json格式是“poly”和“RLE”,具體來說若需要標註是object instance,則“segmentation”是列表型別“[[...]]”,crowd為false;若需要標註是collection,則“segmentation”是字典型別“{counts: [...],size: [...]}”,"counts" 為列表型別,是mask的未壓縮成RLE格式的輪廓頂點,“size”為該影象的寬高, crowd欄位為true。

2) COCO stuff 的segmentation,由於需要crowd為true,所以segmentation是RLE,根據

     實現,使用的是mask encoded後的壓縮RLE格式。

可以通過各種標註多邊形工具進行分割的多邊形標註,比如麻省理工學院的基於Web標註的工具LabelMe,方便多人網上標註。

對標註後的多邊形,需自己寫程式碼轉換。轉換過程有幾個opencv函式可能需要用到:

1) fillPoly

2) findContour