計算機視覺標準資料集整理—PASCAL VOC資料集
資料集下載
PASCAL VOC為影象識別和分類提供了一整套標準化的優秀的資料集,從2005年到2012年每年都會舉行一場影象識別challenge。此資料集可以用於影象分類、目標檢測、影象分割。
資料集下載映象地址如下(包括VOC2007和VOC2012):
PASCAL:pattern analysis,statistical modelling and computationallearning
VOC:visual object classes
該挑戰的主要目的是識別真實場景中一些類別的物體。在該挑戰中,這是一個監督學習的問題,訓練集以帶標籤的圖片的形式給出。這些物體包括20類:
- Person: person;
- Animal: bird, cat, cow, dog, horse, sheep;
- Vehicle: aeroplane, bicycle, boat, bus,car, motorbike, train;
- Indoor: bottle, chair, dining table, pottedplant, sofa, tv/monitor;
該挑戰主要包括三類任務:分類(classification),檢測(detection),和分割(segmentation)
包括任務
Classification/DetectionCompetitions
Classification:對20類中的每一類,預測test image中該類的presence/absence;
Detection:預測test image中物體的boundingbox以及該物體屬於20類中的哪一類;
對於這兩類任務,允許參與者通過兩種方式參與:
- 使用除VOC測試集以外的任何資料集來構建、訓練他們的分類/檢測系統;
- 僅使用VOC提供的訓練/校驗集來構建、訓練分類/檢測系統;
前者是為了衡量目前在這些任務上,我們的方法到底可以到達怎樣一種程度的成功;
後者則是為了建立一種在指定資料集上最為成功的方法。
Segmentation Competition
Segmentation:在test image上產生一個畫素級別的分割,給出每一個畫素屬於哪一類,包括“背景”類。
Action Classification Competition
Action Classification:預測靜態影象中人做出的動作。
該任務有兩種形式,一種是:影象中做出動作的人被一個bounding box框出來;
另一種是:影象中做出動作的人僅被一個點標示出來,該點落在這個人身體的某處。
後者面向的是基於影象中只給定一個人的大概位置的方法。
ImageNet LargeScale Visual Recognition Competition
該任務的內容是預測影象中的內容,這對影象檢索、自動標註等目標的實現有重要意義。
訓練集是ImageNet資料集(10,000,000張標註了的影象,包含10,000多類物體)的一個子集。
測試集在給出的時候沒有任何的標註、分割和標籤。該任務的目的是提出一種方法,可以產生一些標籤,對應著影象中出現了哪些物體。
VOC2012中只要求識別影象中出現的主要物體,不要求指定物體出現的位置,即只識別不定位。
Person LayoutTaster Competition
Person Layout:即人體輪廓佈局。該任務的目標是預測人體部位(頭,手,腳)的bounding box和對應的label》
資料集簡介
- 訓練集由一套影象組成:每個影象擁有一個對應的標註檔案,給出了影象中出現的物體的bounding box和class label,該
- 物體屬於上述20類中的某一類。同一張影象中,可能出現屬於多個類別的多個物體。
- 所有的標註圖片都有Detection需要的label,但只有部分資料有Segmentation Label。
- VOC2007中包含9963張標註過的圖片, 由train/val/test三部分組成, 共標註出24,640個物體。
- VOC2007的test資料label已經公佈, 之後的沒有公佈(只有圖片,沒有label)。
- 對於檢測任務,VOC2012的trainval/test包含08-11年的所有對應圖片。 trainval有11540張圖片共27450個物體。
- 對於分割任務, VOC2012的trainval包含07-11年的所有對應圖片, test只包含08-11。trainval有 2913張圖片共6929個物體。
- 這些影象中的一部分影象還擁有畫素級的標註,用於segmentationcompetition.
- 用於action classification的圖片集與用於classification/detection/segmentation的圖片集不相交。它們被部分地標註上了影象中人的bounding box,參考點和動作。
- 用於person layout taster的影象,被額外的標註上了人的身體部位(頭、手、腳),其測試集與主任務(classification/detection)的測試集不相交。
- 資料集按1:1的比例被分為訓練(驗證)集和測試集。這兩部分的影象中類別的分佈也大致相等。
資料集檔案結構
Annotation
Annotations資料夾中存放的是xml格式的標籤檔案,每一個xml檔案都對應於JPEGImages資料夾中的一張圖片。
格式如下,我們以2007_000033.xml為例。
ImageSets
ImageSets存放的是每一種型別的challenge對應的影象資料。
ImageSets下的四個資料夾,如下:
- Action下存放的是人的動作(running、jumping等等,這也是VOC challenge的一部分)
- Layout下存放的是人體部位(head、hand、feet等等,這也是VOC challenge的一部分)
- Main下存放的是影象物體識別的資料,總共分為20類
Main資料夾下包含了20個分類的***_train.txt、***_val.txt和***_trainval.txt。
這些txt中的內容都差不多如下:
前面的表示影象的name,後面的1代表正樣本,-1代表負樣本。
_train中存放的是訓練使用的資料,每一個class的train資料都有5717個;
_val中存放的是驗證結果使用的資料,每一個class的val資料都有5832個;
_trainval將上面兩個進行了合併,每一個class有11540個;
需要保證的是train和val兩者沒有交集,也就是訓練資料和驗證資料不能有重複,在選取訓練資料的時候,也應該是隨機產生的。
- Segmentation下存放的是可用於分割的圖片的編號。
*_train中存放的是訓練集的圖片編號。
*_val中存放的是驗證集的圖片編號。
*_trainval是上面兩者的合併集合。
train和val包含的圖片沒有交集。
JPEGImages
JPEGImages資料夾中包含了PASCAL VOC所提供的所有的圖片,包含訓練圖片和測試圖片,共有17125張。圖片均以“年份_編號.jpg”格式命名。圖片的尺寸大小不一,所以在後面訓練的時候需要對圖片進行resize操作。圖片的畫素尺寸大小不一,但是橫向圖的尺寸大約在500*375左右,縱向圖的尺寸大約在375*500左右,基本不會偏差超過100。(在之後的訓練中,第一步就是將這些圖片都resize到300*300或是500*500,所有原始圖片不能離這個標準過遠,具體resize方式可以看最下面github連結裡data.py。)
這些影象就是用來進行訓練和測試驗證的影象資料。
SegmentationClass
這裡麵包含了2913張圖片,每一張圖片都對應JPEGImages裡面的相應編號的圖片。 圖片的畫素顏色共有20種,對應20類物體。SegmentationObject
這裡面同樣包含了2913張圖片,圖片編號都與Class裡面的圖片編號相同。
這裡面的圖片和Class裡面圖片的區別在於,這是針對Object的。
在Class裡面,一張圖片裡如果有多架飛機,那麼會全部標註為紅色。
而在Object裡面,同一張圖片裡面的飛機會被不同顏色標註出來。
相關推薦
計算機視覺標準資料集整理—PASCAL VOC資料集
資料集下載 PASCAL VOC為影象識別和分類提供了一整套標準化的優秀的資料集,從2005年到2012年每年都會舉行一場影象識別challenge。此資料集可以用於影象分類、目標檢測、影象分割。 資料集下載映象地址如下(包括VOC2007和VOC2012):
【計算機視覺】PASCAL VOC資料集分析
<annotation> <folder>VOC2012</folder> <filename>2007_000392.jpg</filename>
計算機視覺標準資料集整理—CIFAR-100資料集
CIFAR-100資料集(用作100類的影象分類) 這個資料集和CIFAR-10相比,它具有100個類,大約600張/類,每類500張訓練,500張測試; 這100類又可以grouped成20
計算機視覺標準資料集整理—COCO資料集
COCO資料集由微軟贊助,其對於影象的標註資訊不僅有類別、位置資訊,還有對影象的語義文字描述,COCO資料集的開源使得近兩三年來影象分割語義理解取得了巨大的進展,也幾乎成為了影象語義理解演算法效能評價的“標準”資料集。Google的開源show and tell生成模型就是在此資料集上測試的。 這個資料
深度學習與計算機視覺(PB-09)-使用HDF5儲存大資料集
到目前為止,我們使用的資料集都能夠全部載入到記憶體中。對於小資料集,我們可以載入全部影象資料到記憶體中,進行預處理,並進行前向傳播處理。然而,對於大規模資料集(比如ImageNet),我們需要建立資料生成器,每次只訪問一小部分資料集(比如mini-batch),然後對batch資料進行預處理
Pascal Voc資料集詳細介紹
1.首先了解VOC2012資料集的內容 資料集下載後解壓得到一個名為VOCdevkit的資料夾,該資料夾結構如下: . └── VOCdevkit #根目錄 └── VOC2012 #不同年份的資料集,這裡只下載了2012的,還有2007等其它年份的
PASCAL VOC 資料集
PASCAL VOC為影象識別和分類提供了一整套標準化的優秀的資料集,從2005年到2012年每年都會舉行一場影象識別challenge。 下載完之後解壓,可以在VOCdevkit目錄下的VOC20
Pascal Voc資料集詳細分析
前言 做深度學習目標檢測方面的同學怎麼都會接觸到PASCAL VOC這個資料集。也許很少用到整個資料集,但是一般都會按照它的格式準備自己的資料集。所以這裡就來詳細的記錄一下PASCAL VOC的格式,包括目錄構成以及各個資料夾的內容格式,方便以後自己按照VOC
PASCAL VOC資料集分析
接下來需要研究的是如何自己生成訓練資料和測試資料,將在下一篇中闡述。2. 轉載2 現在深度學習很多框架都在使用VOC資料集,來研究一下voc資料集的具體內容 一般voc解壓出來後都包括Annotations,ImageSets,JPEFImages,SegmentationClass ,Segmentatio
PASCAL VOC資料集分析(分類部分)
VOC2007資料集共包含:訓練集(5011幅),測試集(4952幅),共計9963幅圖,共包含20個種類。 資料集的組成架構如下: Annotations —目標真值區域ImageSets —-類別標籤JPEGImages —–影象SegmentationClassSegmentationObje
PASCAL VOC資料集The PASCAL Object Recognition Database Collection
The PASCAL Object Recognition Database Collection News 04-Apr-07: The VOC2007 challenge development kit is now available.Objectives To
PASCAL VOC資料集分析(檢測部分)
Pascal VOC 資料集介紹介紹Pascal VOC資料集:Challenge and tasks, 只介紹Detection與Segmentation相關內容。資料格式 Dataset衡量方式 Evaluationvoc2007, voc2012Challenge
【Detection】物體識別-製作PASCAL VOC資料集
程式碼下載:github PASCAL VOC資料集 PASCAL VOC為影象識別和分類提供了一整套標準化的優秀的資料集,從2005年到2012年每年都會舉行一場影象識別challenge 預設為20類物體 1 資料集結構 ①JPEGImages JPEGImages資料夾中包含了PASCAL
wider face資料集轉化為VOC資料集(matlab實現)
head.xml <annotation> <folder>widerface</folder> <filename>%06d.jpg</filename> <source>
GluonCV:用Pascal VOC資料訓練YOLO v3(下)訓練部分
本教程介紹了訓練GluonCV提供的YOLOv3目標檢測模型的基本步驟。 具體來說,展示瞭如何通過堆疊GluonCV元件來構建state-of-the-art的YOLOv3模型。 首先,關於訓練有三點說明: (1)初始學習率預設是0.001,我訓練loss是nan
GluonCV:用Pascal VOC資料訓練YOLO v3(上)準備資料+簡單訓練命令
1.GluonCV簡介 GluonCV提供計算機視覺中state-of-the-art(SOTA)深度學習模型的實現。 它專為工程師,研究人員和學生設計,可基於這些模型快速產生原型產品和研究思路。 該工具包提供四個主要功能: (1)訓練指令碼用來複現研究論
目標檢測之-Caffe-SSD系列(一)資料的處理-PASCAL VOC
目標檢測任務之資料的處理 常見的目標檢測資料集之PASCAL VOC 1 . PASCAL VOC資料集介紹 資料集名稱 訓練集(本地訓) 測試集(本地測) PAS
製作PASCAL VOC格式的檢測資料集,生成trainval.txt, train.txt, val.txt, test.txt檔案
import os import random xmlfilepath=r'C:\Users\Yeh Chih-En\Desktop\VOC\Annotations' saveBasePath=r"C:\Users\Yeh Chih-En\Desktop\VOC" trainval
製作PASCAL VOC格式的分割資料集,生成trainval.txt, train.txt, val.txt檔案
import os import random filepath=r'C:\models\research\deeplab\datasets\Headshoulder_dataset\dataset\JPEGImages' saveBasePath=r"C:\models\resear
【計算機視覺演算法崗面經】“吐血”整理:2019秋招資料
轉自:https://blog.csdn.net/liuxiao214/article/details/83043170 感謝整理,侵刪 //2018/09/27 兵荒馬亂、浩浩蕩蕩的秋招終於差不多要結束了。 秋招這段時間真是感慨很多,一時得意一時失意,還要平衡一不小心就來的心理落差