1. 程式人生 > >PASCAL VOC 資料集

PASCAL VOC 資料集

PASCAL VOC為影象識別和分類提供了一整套標準化的優秀的資料集,從2005年到2012年每年都會舉行一場影象識別challenge。 下載完之後解壓,可以在VOCdevkit目錄下的VOC2012中看到如下的檔案:
其中在影象物體識別上著重需要了解的是Annotations、ImageSets和JPEGImages。 ①JPEGImages JPEGImages資料夾中包含了PASCAL VOC所提供的所有的圖片資訊,包括了訓練圖片和測試圖片。 這些影象都是以“年份_編號.jpg”格式命名的。 圖片的畫素尺寸大小不一,但是橫向圖的尺寸大約在500*375左右,縱向圖的尺寸大約在375*500左右,基本不會偏差超過100。(在之後的訓練中,第一步就是將這些圖片都resize到300*300或是500*500,所有原始圖片不能離這個標準過遠。) 這些影象就是用來進行訓練和測試驗證的影象資料。 ②Annotations Annotations資料夾中存放的是xml格式的標籤檔案,每一個xml檔案都對應於JPEGImages資料夾中的一張圖片。
xml檔案的具體格式如下:
  1. <annotation>
  2.     <folder>VOC2012</folder>
  3.     <filename>2007_000392.jpg</filename>                               //檔名  
  4.     <source>
  5.         <database>The VOC2007 Database</database>
  6.         <annotation>PASCAL VOC2007</annotation>
  7.         <
    image>flickr</image>
  8.     </source>
  9.     <size>                                               //影象尺寸(長寬以及通道數)                        
  10.         <width>500</width>
  11.         <height>332</height>
  12.         <depth>3</depth>
  13.     </size>
  14.     <segmented>1
    </segmented>
  15.     <object>                                                           //檢測到的物體  
  16.         <name>horse</name>                                         //物體類別  
  17.         <pose>Right</pose>
  18.         <truncated>0</truncated>
  19.         <difficult>0</difficult>
  20.         <bndbox>                                                   //bounding-box(包含左下角和右上角xy座標)  
  21.             <xmin>100</xmin>
  22.             <ymin>96</ymin>
  23.             <xmax>355</xmax>
  24.             <ymax>324</ymax>
  25.         </bndbox>
  26.     </object>
  27.     <object>                                                           //檢測到多個物體  
  28.         <name>person</name>
  29.         <pose>Unspecified</pose>
  30.         <truncated>0</truncated>
  31.         <difficult>0</difficult>
  32.         <bndbox>
  33.             <xmin>198</xmin>
  34.             <ymin>58</ymin>
  35.             <xmax>286</xmax>
  36.             <ymax>197</ymax>
  37.         </bndbox>
  38.     </object>
  39. </annotation>
對應的圖片為: ImageSets ImageSets存放的是每一種型別的challenge對應的影象資料。 在ImageSets下有四個資料夾: 其中Action下存放的是人的動作(例如running、jumping等等,這也是VOC challenge的一部分) Layout下存放的是具有人體部位的資料(人的head、hand、feet等等,這也是VOC challenge的一部分) Main下存放的是影象物體識別的資料,總共分為20類。 Segmentation下存放的是可用於分割的資料。 在這裡主要考察Main資料夾。 Main資料夾下包含了20個分類的***_train.txt、***_val.txt和***_trainval.txt。 需要保證的是train和val兩者沒有交集,也就是訓練資料和驗證資料不能有重複,在選取訓練資料的時候 ,也應該是隨機產生的。

相關推薦

Pascal Voc資料詳細介紹

1.首先了解VOC2012資料集的內容 資料集下載後解壓得到一個名為VOCdevkit的資料夾,該資料夾結構如下:  . └── VOCdevkit #根目錄 └── VOC2012 #不同年份的資料集,這裡只下載了2012的,還有2007等其它年份的

計算機視覺標準資料整理—PASCAL VOC資料

資料集下載 PASCAL VOC為影象識別和分類提供了一整套標準化的優秀的資料集,從2005年到2012年每年都會舉行一場影象識別challenge。此資料集可以用於影象分類、目標檢測、影象分割。 資料集下載映象地址如下(包括VOC2007和VOC2012):

【計算機視覺】PASCAL VOC資料分析

<annotation>       <folder>VOC2012</folder>                                  <filename>2007_000392.jpg</filename>            

PASCAL VOC 資料

PASCAL VOC為影象識別和分類提供了一整套標準化的優秀的資料集,從2005年到2012年每年都會舉行一場影象識別challenge。 下載完之後解壓,可以在VOCdevkit目錄下的VOC20

Pascal Voc資料詳細分析

前言 做深度學習目標檢測方面的同學怎麼都會接觸到PASCAL VOC這個資料集。也許很少用到整個資料集,但是一般都會按照它的格式準備自己的資料集。所以這裡就來詳細的記錄一下PASCAL VOC的格式,包括目錄構成以及各個資料夾的內容格式,方便以後自己按照VOC

PASCAL VOC資料分析

接下來需要研究的是如何自己生成訓練資料和測試資料,將在下一篇中闡述。2. 轉載2 現在深度學習很多框架都在使用VOC資料集,來研究一下voc資料集的具體內容 一般voc解壓出來後都包括Annotations,ImageSets,JPEFImages,SegmentationClass ,Segmentatio

PASCAL VOC資料分析(分類部分)

VOC2007資料集共包含:訓練集(5011幅),測試集(4952幅),共計9963幅圖,共包含20個種類。 資料集的組成架構如下: Annotations —目標真值區域ImageSets —-類別標籤JPEGImages —–影象SegmentationClassSegmentationObje

PASCAL VOC資料The PASCAL Object Recognition Database Collection

The PASCAL Object Recognition Database Collection News 04-Apr-07: The VOC2007 challenge development kit is now available.Objectives To

PASCAL VOC資料分析(檢測部分)

Pascal VOC 資料集介紹介紹Pascal VOC資料集:Challenge and tasks, 只介紹Detection與Segmentation相關內容。資料格式  Dataset衡量方式  Evaluationvoc2007, voc2012Challenge

【Detection】物體識別-製作PASCAL VOC資料

程式碼下載:github PASCAL VOC資料集 PASCAL VOC為影象識別和分類提供了一整套標準化的優秀的資料集,從2005年到2012年每年都會舉行一場影象識別challenge 預設為20類物體 1 資料集結構 ①JPEGImages JPEGImages資料夾中包含了PASCAL

VOC資料顏色對應關係與程式碼

VOC顏色和分類的對於關係:       code: def voc_colormap(N=256): def bitget(val, idx): return ((val & (1 << idx)) != 0)

VOC資料用於製作tensorflow所需格式

VOC資料集 VOC主要有三個重要的資料夾:Annotations、ImageSets和JPEGImages。分別是標註資訊、分割資訊和原始圖片等。 公開資料集有現成的對應檔案,前人已經做好標註工作。 在初步訓練網路時,選擇該組比較完備的資料,確實是一個比較快捷的方法。 XML到CS

PACAL VOC資料格式的相關問題

獲取指定畫素值的座標 image_path = 'C:\\Users\\Yeh Chih-En\\Desktop\\test_images\\0bb0672f1afd6baaf94c516bcfb7dfae.png' image = Image.open(i

yolo 學習筆記分享之--VOC資料

參考: <Pascal VOC & COCO資料集介紹 & 轉換> http://www.cnblogs.com/pprp/p/9629752.html 《Pascal Voc資料集詳細分析》https://blog.csdn.net/u01383270

配置FCN 8s voc資料

按著博文http://blog.csdn.net/u012968002/article/details/78958090 的流程走的  主要是各種路徑要搞清楚 參見http://blog.csdn.net/supe_king/article/details/58121993 中間出現在

Deeplab_v2+VOC資料

概述 Deeplab系列,是影象語意分割的經典之作,用深度學習的方法實現影象分割,繞不過系統學習Deeplab系列,而學習的最快途徑就是先把demo跑起來,之後再去細讀文獻和程式碼。 本部落格主要是基於v2版本的deeplab,使用VGG16模型,在VOC201

ICnet基於VOC資料的訓練

Voc4ICnet 資料集準備的目的:ICNET基於VOc資料集的訓練,和同時做分割和檢測的Blitznet做對比. 一、資料集標籤製作與準備: Pascal VOC資料集可用於目標檢測和分割,提供了語義分割標籤和例項分割標籤. 本文中使用的資料集為原始的pas

基於keras的YOLOv3在VOC資料上訓練測試

一、編譯環境 windows7 Anaconda+python3.6+keras+tensroflow+pyCharm 二、步驟 測試 從上文第二個github上下載工程,並用

VOC資料顏色表

類別名稱 R G B background 0 0 0 背景 aeroplane 128 0 0 飛機 bicycle 0 128 0 bird 128 128 0 boat 0 0 128 bottle 128 0 128 瓶子 bus 0 128 128 大巴 car 128 1

VOC 資料

可變形網路 :https://github.com/msracver/Deformable-ConvNets VOC資料集: Test 引數 ('PascalVOC', '2007_test', './data', './data/VOCdevkit', './output/rcnn/voc/resne