Faster R-CNN 資料集的檔案格式
阿新 • • 發佈:2019-01-22
通過標記影象獲得了影象特徵的座標,類名,
為了給Faster R-CNN訓練資料集,需要把標註資料統一化成xml格式,
該格式如下
<annotation> <folder>VOC2007</folder> # 資料集的名稱我是用的是VOC2007的資料集格式 <filename>000000.jpg</filename> # 圖片名,最好能按照規範採用六位數字命名 <source> #註釋資訊,無所謂有無 <database>The VOC2007 Database</database> <annotation>PASCAL VOC2007</annotation> <image>flickr</image> <flickrid>321862192</flickrid> </source> <owner> #註釋資訊,無所謂有無 <flickrid>Xu</flickrid> <name>?</name> </owner> <size>#影象尺寸 <width>340</width> <height>520</height> <depth>3</depth> </size> <segmented>0</segmented> <object> # 標註了幾個地方,就有幾個object項 <name>person</name> #class name,不要使用大寫字母 <pose>Frontal</pose> <truncated>1</truncated> <difficult>0</difficult> <bndbox>#座標,注意座標的順序,座標是以左上角為原點的 <xmin>599</xmin> <ymin>741</ymin> <xmax>697</xmax> <ymax>684</ymax> </bndbox> </object> <object> <name>person</name> <pose>Frontal</pose> <truncated>1</truncated> <difficult>0</difficult> <bndbox> <xmin>847</xmin> <ymin>1150</ymin> <xmax>897</xmax> <ymax>1029</ymax> </bndbox> </object> <object> <name>person</name> <pose>Frontal</pose> <truncated>1</truncated> <difficult>0</difficult> <bndbox> <xmin>595</xmin> <ymin>1142</ymin> <xmax>640</xmax> <ymax>1039</ymax> </bndbox> </object> </annotation>