1. 程式人生 > >Faster R-CNN 資料集的檔案格式

Faster R-CNN 資料集的檔案格式

通過標記影象獲得了影象特徵的座標,類名,

為了給Faster R-CNN訓練資料集,需要把標註資料統一化成xml格式,

該格式如下

<annotation>
	<folder>VOC2007</folder> # 資料集的名稱我是用的是VOC2007的資料集格式
	<filename>000000.jpg</filename> # 圖片名,最好能按照規範採用六位數字命名
	<source> #註釋資訊,無所謂有無
        <database>The VOC2007 Database</database>
        <annotation>PASCAL VOC2007</annotation>
        <image>flickr</image>
        <flickrid>321862192</flickrid>
    </source>
    <owner> #註釋資訊,無所謂有無
        <flickrid>Xu</flickrid>
        <name>?</name>
    </owner>
	<size>#影象尺寸
		<width>340</width>
		<height>520</height>
		<depth>3</depth>
	</size>
	<segmented>0</segmented>
	<object> # 標註了幾個地方,就有幾個object項
		<name>person</name> #class name,不要使用大寫字母
		<pose>Frontal</pose>
		<truncated>1</truncated>
		<difficult>0</difficult>
		<bndbox>#座標,注意座標的順序,座標是以左上角為原點的
			<xmin>599</xmin>
			<ymin>741</ymin>
			<xmax>697</xmax>
			<ymax>684</ymax>
		</bndbox>
	</object>
	<object>
		<name>person</name>
		<pose>Frontal</pose>
		<truncated>1</truncated>
		<difficult>0</difficult>
		<bndbox>
			<xmin>847</xmin>
			<ymin>1150</ymin>
			<xmax>897</xmax>
			<ymax>1029</ymax>
		</bndbox>
	</object>
	<object>
		<name>person</name>
		<pose>Frontal</pose>
		<truncated>1</truncated>
		<difficult>0</difficult>
		<bndbox>
			<xmin>595</xmin>
			<ymin>1142</ymin>
			<xmax>640</xmax>
			<ymax>1039</ymax>
		</bndbox>
	</object>
</annotation>