1. 程式人生 > >計算機視覺標準資料集整理—PASCAL VOC資料集

計算機視覺標準資料集整理—PASCAL VOC資料集

資料集下載

PASCAL VOC為影象識別和分類提供了一整套標準化的優秀的資料集,從2005年到2012年每年都會舉行一場影象識別challenge。此資料集可以用於影象分類、目標檢測、影象分割。

資料集下載映象地址如下(包括VOC2007和VOC2012):


PASCAL:pattern analysis,statistical modelling and computationallearning 


VOC:visual object classes

該挑戰的主要目的是識別真實場景中一些類別的物體。在該挑戰中,這是一個監督學習的問題,訓練集以帶標籤的圖片的形式給出。這些物體包括20類:

  • Person: person;
  • Animal: bird, cat, cow, dog, horse, sheep;
  • Vehicle: aeroplane, bicycle, boat, bus,car, motorbike, train;
  • Indoor: bottle, chair, dining table, pottedplant, sofa, tv/monitor;
    

該挑戰主要包括三類任務:分類(classification)檢測(detection)和分割(segmentation)

 包括任務

Classification/DetectionCompetitions

Classification:對20類中的每一類,預測test image中該類的presence/absence; 


Detection:預測test image中物體的boundingbox以及該物體屬於20類中的哪一類;

對於這兩類任務,允許參與者通過兩種方式參與:

  • 使用除VOC測試集以外的任何資料集來構建、訓練他們的分類/檢測系統;
  • 僅使用VOC提供的訓練/校驗集來構建、訓練分類/檢測系統;

前者是為了衡量目前在這些任務上,我們的方法到底可以到達怎樣一種程度的成功;

後者則是為了建立一種在指定資料集上最為成功的方法。

Segmentation Competition

Segmentation:在test image上產生一個畫素級別的分割,給出每一個畫素屬於哪一類,包括“背景”類。


Action Classification  Competition

Action Classification:預測靜態影象中人做出的動作。 


該任務有兩種形式,一種是:影象中做出動作的人被一個bounding box框出來;

                           另一種是:影象中做出動作的人僅被一個點標示出來,該點落在這個人身體的某處。

後者面向的是基於影象中只給定一個人的大概位置的方法。


ImageNet LargeScale Visual Recognition Competition

該任務的內容是預測影象中的內容,這對影象檢索、自動標註等目標的實現有重要意義。

訓練集是ImageNet資料集(10,000,000張標註了的影象,包含10,000多類物體)的一個子集。

測試集在給出的時候沒有任何的標註、分割和標籤。該任務的目的是提出一種方法,可以產生一些標籤,對應著影象中出現了哪些物體。

VOC2012中只要求識別影象中出現的主要物體,不要求指定物體出現的位置,即只識別不定位。

Person LayoutTaster Competition

Person Layout:即人體輪廓佈局。該任務的目標是預測人體部位(頭,手,腳)的bounding box和對應的label》


資料集簡介

  • 訓練集由一套影象組成:每個影象擁有一個對應的標註檔案,給出了影象中出現的物體的bounding box和class label,該
  • 物體屬於上述20類中的某一類。同一張影象中,可能出現屬於多個類別的多個物體。
  • 所有的標註圖片都有Detection需要的label,但只有部分資料有Segmentation Label。
  • VOC2007中包含9963張標註過的圖片, 由train/val/test三部分組成, 共標註出24,640個物體。
  • VOC2007的test資料label已經公佈, 之後的沒有公佈(只有圖片,沒有label)。
  • 對於檢測任務,VOC2012的trainval/test包含08-11年的所有對應圖片。 trainval有11540張圖片共27450個物體。
  • 對於分割任務, VOC2012的trainval包含07-11年的所有對應圖片, test只包含08-11。trainval有 2913張圖片共6929個物體。
  • 這些影象中的一部分影象還擁有畫素級的標註,用於segmentationcompetition.
  • 用於action classification的圖片集與用於classification/detection/segmentation的圖片集不相交。它們被部分地標註上了影象中人的bounding box,參考點和動作。
  • 用於person layout taster的影象,被額外的標註上了人的身體部位(頭、手、腳),其測試集與主任務(classification/detection)的測試集不相交。
  • 資料集按1:1的比例被分為訓練(驗證)集和測試集。這兩部分的影象中類別的分佈也大致相等。

資料集檔案結構


 Annotation

Annotations資料夾中存放的是xml格式的標籤檔案,每一個xml檔案都對應於JPEGImages資料夾中的一張圖片。


格式如下,我們以2007_000033.xml為例。




ImageSets

ImageSets存放的是每一種型別的challenge對應的影象資料。 


ImageSets下的四個資料夾,如下:


  • Action下存放的是人的動作(running、jumping等等,這也是VOC challenge的一部分)
  
  • Layout下存放的是人體部位(head、hand、feet等等,這也是VOC challenge的一部分)

  • Main下存放的是影象物體識別的資料,總共分為20類

Main資料夾下包含了20個分類的***_train.txt、***_val.txt和***_trainval.txt。

這些txt中的內容都差不多如下:

前面的表示影象的name,後面的1代表正樣本,-1代表負樣本。

_train中存放的是訓練使用的資料,每一個class的train資料都有5717個;

_val中存放的是驗證結果使用的資料,每一個class的val資料都有5832個;

_trainval將上面兩個進行了合併,每一個class有11540個;

需要保證的是train和val兩者沒有交集,也就是訓練資料和驗證資料不能有重複,在選取訓練資料的時候,也應該是隨機產生的。

  • Segmentation下存放的是可用於分割的圖片的編號。
  

        *_train中存放的是訓練集的圖片編號。

 
       *_val中存放的是驗證集的圖片編號。 

 
       *_trainval是上面兩者的合併集合。

 
       train和val包含的圖片沒有交集。

JPEGImages

JPEGImages資料夾中包含了PASCAL VOC所提供的所有的圖片,包含訓練圖片和測試圖片,共有17125張。圖片均以“年份_編號.jpg”格式命名。圖片的尺寸大小不一,所以在後面訓練的時候需要對圖片進行resize操作。

圖片的畫素尺寸大小不一,但是橫向圖的尺寸大約在500*375左右,縱向圖的尺寸大約在375*500左右,基本不會偏差超過100。(在之後的訓練中,第一步就是將這些圖片都resize到300*300或是500*500,所有原始圖片不能離這個標準過遠,具體resize方式可以看最下面github連結裡data.py。)

這些影象就是用來進行訓練和測試驗證的影象資料。


SegmentationClass

這裡麵包含了2913張圖片,每一張圖片都對應JPEGImages裡面的相應編號的圖片。 圖片的畫素顏色共有20種,對應20類物體。

SegmentationObject

這裡面同樣包含了2913張圖片,圖片編號都與Class裡面的圖片編號相同。

這裡面的圖片和Class裡面圖片的區別在於,這是針對Object的。

在Class裡面,一張圖片裡如果有多架飛機,那麼會全部標註為紅色。

而在Object裡面,同一張圖片裡面的飛機會被不同顏色標註出來。



相關推薦

計算機視覺標準資料整理PASCAL VOC資料

資料集下載 PASCAL VOC為影象識別和分類提供了一整套標準化的優秀的資料集,從2005年到2012年每年都會舉行一場影象識別challenge。此資料集可以用於影象分類、目標檢測、影象分割。 資料集下載映象地址如下(包括VOC2007和VOC2012):

計算機視覺PASCAL VOC資料分析

<annotation>       <folder>VOC2012</folder>                                  <filename>2007_000392.jpg</filename>            

計算機視覺標準資料整理—CIFAR-100資料

CIFAR-100資料集(用作100類的影象分類) 這個資料集和CIFAR-10相比,它具有100個類,大約600張/類,每類500張訓練,500張測試; 這100類又可以grouped成20

計算機視覺標準資料整理—COCO資料

COCO資料集由微軟贊助,其對於影象的標註資訊不僅有類別、位置資訊,還有對影象的語義文字描述,COCO資料集的開源使得近兩三年來影象分割語義理解取得了巨大的進展,也幾乎成為了影象語義理解演算法效能評價的“標準”資料集。Google的開源show and tell生成模型就是在此資料集上測試的。  這個資料

深度學習與計算機視覺(PB-09)-使用HDF5儲存大資料

到目前為止,我們使用的資料集都能夠全部載入到記憶體中。對於小資料集,我們可以載入全部影象資料到記憶體中,進行預處理,並進行前向傳播處理。然而,對於大規模資料集(比如ImageNet),我們需要建立資料生成器,每次只訪問一小部分資料集(比如mini-batch),然後對batch資料進行預處理

Pascal Voc資料詳細介紹

1.首先了解VOC2012資料集的內容 資料集下載後解壓得到一個名為VOCdevkit的資料夾,該資料夾結構如下:  . └── VOCdevkit #根目錄 └── VOC2012 #不同年份的資料集,這裡只下載了2012的,還有2007等其它年份的

PASCAL VOC 資料

PASCAL VOC為影象識別和分類提供了一整套標準化的優秀的資料集,從2005年到2012年每年都會舉行一場影象識別challenge。 下載完之後解壓,可以在VOCdevkit目錄下的VOC20

Pascal Voc資料詳細分析

前言 做深度學習目標檢測方面的同學怎麼都會接觸到PASCAL VOC這個資料集。也許很少用到整個資料集,但是一般都會按照它的格式準備自己的資料集。所以這裡就來詳細的記錄一下PASCAL VOC的格式,包括目錄構成以及各個資料夾的內容格式,方便以後自己按照VOC

PASCAL VOC資料分析

接下來需要研究的是如何自己生成訓練資料和測試資料,將在下一篇中闡述。2. 轉載2 現在深度學習很多框架都在使用VOC資料集,來研究一下voc資料集的具體內容 一般voc解壓出來後都包括Annotations,ImageSets,JPEFImages,SegmentationClass ,Segmentatio

PASCAL VOC資料分析(分類部分)

VOC2007資料集共包含:訓練集(5011幅),測試集(4952幅),共計9963幅圖,共包含20個種類。 資料集的組成架構如下: Annotations —目標真值區域ImageSets —-類別標籤JPEGImages —–影象SegmentationClassSegmentationObje

PASCAL VOC資料The PASCAL Object Recognition Database Collection

The PASCAL Object Recognition Database Collection News 04-Apr-07: The VOC2007 challenge development kit is now available.Objectives To

PASCAL VOC資料分析(檢測部分)

Pascal VOC 資料集介紹介紹Pascal VOC資料集:Challenge and tasks, 只介紹Detection與Segmentation相關內容。資料格式  Dataset衡量方式  Evaluationvoc2007, voc2012Challenge

【Detection】物體識別-製作PASCAL VOC資料

程式碼下載:github PASCAL VOC資料集 PASCAL VOC為影象識別和分類提供了一整套標準化的優秀的資料集,從2005年到2012年每年都會舉行一場影象識別challenge 預設為20類物體 1 資料集結構 ①JPEGImages JPEGImages資料夾中包含了PASCAL

wider face資料轉化為VOC資料(matlab實現)

head.xml <annotation> <folder>widerface</folder> <filename>%06d.jpg</filename> <source>

GluonCV:用Pascal VOC資料訓練YOLO v3(下)訓練部分

本教程介紹了訓練GluonCV提供的YOLOv3目標檢測模型的基本步驟。 具體來說,展示瞭如何通過堆疊GluonCV元件來構建state-of-the-art的YOLOv3模型。  首先,關於訓練有三點說明: (1)初始學習率預設是0.001,我訓練loss是nan

GluonCV:用Pascal VOC資料訓練YOLO v3(上)準備資料+簡單訓練命令

1.GluonCV簡介 GluonCV提供計算機視覺中state-of-the-art(SOTA)深度學習模型的實現。 它專為工程師,研究人員和學生設計,可基於這些模型快速產生原型產品和研究思路。 該工具包提供四個主要功能:  (1)訓練指令碼用來複現研究論

目標檢測之-Caffe-SSD系列(一)資料的處理-PASCAL VOC

目標檢測任務之資料的處理 常見的目標檢測資料集之PASCAL VOC 1 . PASCAL VOC資料集介紹 資料集名稱 訓練集(本地訓) 測試集(本地測) PAS

製作PASCAL VOC格式的檢測資料,生成trainval.txt, train.txt, val.txt, test.txt檔案

import os import random xmlfilepath=r'C:\Users\Yeh Chih-En\Desktop\VOC\Annotations' saveBasePath=r"C:\Users\Yeh Chih-En\Desktop\VOC" trainval

製作PASCAL VOC格式的分割資料,生成trainval.txt, train.txt, val.txt檔案

import os import random filepath=r'C:\models\research\deeplab\datasets\Headshoulder_dataset\dataset\JPEGImages' saveBasePath=r"C:\models\resear

計算機視覺演算法崗面經】“吐血”整理:2019秋招資料

轉自:https://blog.csdn.net/liuxiao214/article/details/83043170 感謝整理,侵刪 //2018/09/27 兵荒馬亂、浩浩蕩蕩的秋招終於差不多要結束了。 秋招這段時間真是感慨很多,一時得意一時失意,還要平衡一不小心就來的心理落差