1. 程式人生 > >Pascal Voc資料集詳細分析

Pascal Voc資料集詳細分析

前言

做深度學習目標檢測方面的同學怎麼都會接觸到PASCAL VOC這個資料集。也許很少用到整個資料集,但是一般都會按照它的格式準備自己的資料集。所以這裡就來詳細的記錄一下PASCAL VOC的格式,包括目錄構成以及各個資料夾的內容格式,方便以後自己按照VOC的標準格式製作自己的資料集。

正文

相關網址

VOCdevkit資料夾

資料集下載後解壓得到一個名為VOCdevkit的資料夾,該資料夾結構如下:

.
└── VOCdevkit     #根目錄
    └── VOC2012   #不同年份的資料集,這裡只下載了2012的,還有2007等其它年份的
        ├── Annotations        #存放xml檔案,與JPEGImages中的圖片一一對應,解釋圖片的內容等等
├── ImageSets #該目錄下存放的都是txt檔案,txt檔案中每一行包含一個圖片的名稱,末尾會加上±1表示正負樣本 │ ├── Action │ ├── Layout │ ├── Main │ └── Segmentation ├── JPEGImages #存放源圖片 ├── SegmentationClass #存放的是圖片,分割後的效果,見下文的例子 └── SegmentationObject #存放的是圖片,分割後的效果,見下文的例子

這裡大概介紹一下各個資料夾的內容,更細節的介紹將在後文給出:
- Annotation資料夾存放的是xml檔案,該檔案是對圖片的解釋,每張圖片都對於一個同名的xml檔案。
- ImageSets資料夾存放的是txt檔案,這些txt將資料集的圖片分成了各種集合。如Main下的train.txt中記錄的是用於訓練的圖片集合
- JPEGImages資料夾存放的是資料集的原圖片
- SegmentationClass以及SegmentationObject資料夾存放的都是圖片,且都是影象分割結果圖(樓主沒用過,所以不清楚)

Annotation資料夾

Annotation資料夾的內容如下:
這裡寫圖片描述


其中xml主要介紹了對應圖片的基本資訊,如來自那個資料夾、檔名、來源、影象尺寸以及影象中包含哪些目標以及目標的資訊等等,內容如下:

<annotation>
    <folder>VOC2012</folder>  #表明圖片來源
    <filename>2007_000027.jpg</filename> #圖片名稱
    <source>                  #圖片來源相關資訊
        <database>The VOC2007 Database</database>
        <annotation>PASCAL VOC2007</annotation>
        <image>flickr</image>
    </source>
    <size>     #影象尺寸
        <width>486</width>
        <height>500</height>
        <depth>3</depth>
    </size>
    <segmented>0</segmented> #是否用於分割
    <object>  #包含的物體
        <name>person</name> #物體類別
        <pose>Unspecified</pose>
        <truncated>0</truncated>
        <difficult>0</difficult>
        <bndbox>  #物體的bbox
            <xmin>174</xmin>
            <ymin>101</ymin>
            <xmax>349</xmax>
            <ymax>351</ymax>
        </bndbox>
        <part> #物體的頭
            <name>head</name>
            <bndbox>
                <xmin>169</xmin>
                <ymin>104</ymin>
                <xmax>209</xmax>
                <ymax>146</ymax>
            </bndbox>
        </part>
        <part>   #物體的手
            <name>hand</name>
            <bndbox>
                <xmin>278</xmin>
                <ymin>210</ymin>
                <xmax>297</xmax>
                <ymax>233</ymax>
            </bndbox>
        </part>
        <part>
            <name>foot</name>
            <bndbox>
                <xmin>273</xmin>
                <ymin>333</ymin>
                <xmax>297</xmax>
                <ymax>354</ymax>
            </bndbox>
        </part>
        <part>
            <name>foot</name>
            <bndbox>
                <xmin>319</xmin>
                <ymin>307</ymin>
                <xmax>340</xmax>
                <ymax>326</ymax>
            </bndbox>
        </part>
    </object>
</annotation>

ImageSets資料夾

ImageSets包含如下四個子資料夾:
這裡寫圖片描述
各個資料夾中存放的是各種用途的TXT檔案。例如在Main資料夾下有名為aeroplane_train.txt的檔案,顧名思義是用於飛機類別的訓練資料。該txt的具體內容如下,其中±1應該表示的是正負樣本的含義(沒有具體研究):

2008_000008 -1
2008_000015 -1
2008_000019 -1
2008_000023 -1
2008_000028 -1
2008_000033  1
2008_000036 -1
2008_000037  1
2008_000041 -1
2008_000045 -1

其中包含的train.txt以及trainval.txt等檔案內容與上面類似。不過博主發現train.txt和trainval.txt內容中光有圖片的名字,末尾沒有標註正負1.

JEPGImages資料夾

該資料夾存放的是資料集的所有源圖片,內容如下:
這裡寫圖片描述

SegmentationClass資料夾

還沒有涉及影象分割領域,不太清楚該資料夾下圖片的用處,截圖貼上來吧:
這裡寫圖片描述

SegmentationObject資料夾

同上,把內容截圖上傳:
這裡寫圖片描述

相關推薦

Pascal Voc資料詳細分析

前言 做深度學習目標檢測方面的同學怎麼都會接觸到PASCAL VOC這個資料集。也許很少用到整個資料集,但是一般都會按照它的格式準備自己的資料集。所以這裡就來詳細的記錄一下PASCAL VOC的格式,包括目錄構成以及各個資料夾的內容格式,方便以後自己按照VOC

Pascal Voc資料詳細介紹

1.首先了解VOC2012資料集的內容 資料集下載後解壓得到一個名為VOCdevkit的資料夾,該資料夾結構如下:  . └── VOCdevkit #根目錄 └── VOC2012 #不同年份的資料集,這裡只下載了2012的,還有2007等其它年份的

【計算機視覺】PASCAL VOC資料分析

<annotation>       <folder>VOC2012</folder>                                  <filename>2007_000392.jpg</filename>            

PASCAL VOC資料分析

接下來需要研究的是如何自己生成訓練資料和測試資料,將在下一篇中闡述。2. 轉載2 現在深度學習很多框架都在使用VOC資料集,來研究一下voc資料集的具體內容 一般voc解壓出來後都包括Annotations,ImageSets,JPEFImages,SegmentationClass ,Segmentatio

PASCAL VOC資料分析(分類部分)

VOC2007資料集共包含:訓練集(5011幅),測試集(4952幅),共計9963幅圖,共包含20個種類。 資料集的組成架構如下: Annotations —目標真值區域ImageSets —-類別標籤JPEGImages —–影象SegmentationClassSegmentationObje

PASCAL VOC資料分析(檢測部分)

Pascal VOC 資料集介紹介紹Pascal VOC資料集:Challenge and tasks, 只介紹Detection與Segmentation相關內容。資料格式  Dataset衡量方式  Evaluationvoc2007, voc2012Challenge

計算機視覺標準資料整理—PASCAL VOC資料

資料集下載 PASCAL VOC為影象識別和分類提供了一整套標準化的優秀的資料集,從2005年到2012年每年都會舉行一場影象識別challenge。此資料集可以用於影象分類、目標檢測、影象分割。 資料集下載映象地址如下(包括VOC2007和VOC2012):

PASCAL VOC 資料

PASCAL VOC為影象識別和分類提供了一整套標準化的優秀的資料集,從2005年到2012年每年都會舉行一場影象識別challenge。 下載完之後解壓,可以在VOCdevkit目錄下的VOC20

PASCAL VOC資料The PASCAL Object Recognition Database Collection

The PASCAL Object Recognition Database Collection News 04-Apr-07: The VOC2007 challenge development kit is now available.Objectives To

【Detection】物體識別-製作PASCAL VOC資料

程式碼下載:github PASCAL VOC資料集 PASCAL VOC為影象識別和分類提供了一整套標準化的優秀的資料集,從2005年到2012年每年都會舉行一場影象識別challenge 預設為20類物體 1 資料集結構 ①JPEGImages JPEGImages資料夾中包含了PASCAL

VOC資料顏色對應關係與程式碼

VOC顏色和分類的對於關係:       code: def voc_colormap(N=256): def bitget(val, idx): return ((val & (1 << idx)) != 0)

VOC資料用於製作tensorflow所需格式

VOC資料集 VOC主要有三個重要的資料夾:Annotations、ImageSets和JPEGImages。分別是標註資訊、分割資訊和原始圖片等。 公開資料集有現成的對應檔案,前人已經做好標註工作。 在初步訓練網路時,選擇該組比較完備的資料,確實是一個比較快捷的方法。 XML到CS

CelebA資料詳細屬性統計

CelebA是香港中文大學提供的包含10,177個名人身份的202,599張人臉圖片的資料集,其提供了5個點的人臉關鍵點座標以及40個屬性,可以在Large-scale CelebFaces Attributes (CelebA) Dataset下載. 各屬性的含義請參考文末給出的連結,本文的程

PACAL VOC資料格式的相關問題

獲取指定畫素值的座標 image_path = 'C:\\Users\\Yeh Chih-En\\Desktop\\test_images\\0bb0672f1afd6baaf94c516bcfb7dfae.png' image = Image.open(i

yolo 學習筆記分享之--VOC資料

參考: <Pascal VOC & COCO資料集介紹 & 轉換> http://www.cnblogs.com/pprp/p/9629752.html 《Pascal Voc資料集詳細分析》https://blog.csdn.net/u01383270

配置FCN 8s voc資料

按著博文http://blog.csdn.net/u012968002/article/details/78958090 的流程走的  主要是各種路徑要搞清楚 參見http://blog.csdn.net/supe_king/article/details/58121993 中間出現在

Deeplab_v2+VOC資料

概述 Deeplab系列,是影象語意分割的經典之作,用深度學習的方法實現影象分割,繞不過系統學習Deeplab系列,而學習的最快途徑就是先把demo跑起來,之後再去細讀文獻和程式碼。 本部落格主要是基於v2版本的deeplab,使用VGG16模型,在VOC201

ICnet基於VOC資料的訓練

Voc4ICnet 資料集準備的目的:ICNET基於VOc資料集的訓練,和同時做分割和檢測的Blitznet做對比. 一、資料集標籤製作與準備: Pascal VOC資料集可用於目標檢測和分割,提供了語義分割標籤和例項分割標籤. 本文中使用的資料集為原始的pas

基於keras的YOLOv3在VOC資料上訓練測試

一、編譯環境 windows7 Anaconda+python3.6+keras+tensroflow+pyCharm 二、步驟 測試 從上文第二個github上下載工程,並用

利用python對泰坦尼克號資料進行分析

一、資料來源 資料集來自於Kaggle。Kaggle是一個數據分析建模的應用競賽平臺。當然也可以從其它地方下。 二、相關工具 2.1 Python 3.5.2 2.2 Anaconda 3 三、牛刀小試 3.1 匯入訓練資料集 import pandas as