1. 程式人生 > >王權富貴:VOC2007資料集格式詳解和下載

王權富貴:VOC2007資料集格式詳解和下載

VOC2012和VOC2007的下載地址:

https://pjreddie.com/projects/pascal-voc-dataset-mirror/

 

​​​​​​​

  • Annotations資料夾 
    • 該檔案下存放的是xml格式的標籤檔案,每個xml檔案都對應於JPEGImages資料夾的一張圖片。
    • 這是最重要的,儲存重要的位置資訊
    • size 是圖片的資訊
    • object 是物體名稱資訊
      • bndbox 是物體Xmin,Ymin,Xmin,Ymax的資訊
    • <annotation>
          <folder>VOC2007</folder>
          <filename>000001.jpg</filename>
          <source>
              <database>My Database</database>
              <annotation>VOC2007</annotation>
              <image>flickr</image>
              <flickrid>NULL</flickrid>
          </source>
          <owner>
              <flickrid>NULL</flickrid>
              <name>QQ974573656</name>
          </owner>
          <size>
              <width>500</width>
              <height>375</height>
              <depth>3</depth>
          </size>
          <segmented>0</segmented>
          <object>
              <name>person</name>
              <pose>Unspecified</pose>
              <truncated>0</truncated>
              <difficult>0</difficult>
              <bndbox>
                  <xmin>213</xmin>
                  <ymin>155</ymin>
                  <xmax>283</xmax>
                  <ymax>374</ymax>
              </bndbox>
          </object>
      </annotation>
      

       

 

  • JPEGImages資料夾
    • 改資料夾下存放的是資料集圖片,包括訓練和測試圖片。
    • 以上兩個是最重要的資訊

 

 

  • ImageSets資料夾
    • 該資料夾下存放了三個檔案,分別是Layout、Main、Segmentation。在這裡我們只用存放影象資料的Main檔案,其他兩個暫且不管。
    • 主要是main資料夾中的資訊
        • 這裡train_test.txt放著的是要訓練的圖片檔名
        • test.txt放著的是測試的的圖片檔名
        • 物品名_test.txt這邊用來計算識別的準確率。(1表示有,0表示不好識別,-1表示沒有)

 

  • SegmentationClass檔案和SegmentationObject檔案。
    • 這兩個檔案都是與影象分割相關
    • 對目標檢測沒有什麼用處