1. 程式人生 > >影象分類和目標檢測常用資料集介紹

影象分類和目標檢測常用資料集介紹

The Caltech-UCSD birds-200-2011 dataset(加利福尼亞理工學院鳥類資料集):

分類數量:200

圖片數量:11,788

每個影象的註釋:15個部分位置,312個二進位制屬性,1邊界框

Labeled faces in the wild:

Labeled Faces in the Wild是一個面部照片資料庫,專為研究無約束人臉識別問題而設計。 該資料集包含從網路收集的13,000多張面部影象。 每張臉都標有圖中人物的名字。 圖中的1680人在資料集中有兩張或更多不同的照片。 這些面孔的唯一限制是它們被Viola-Jones面部探測器探測到。 

現在有四組不同的LFW影象,包括原始影象和三種不同型別的“對齊”影象。 對齊的影象包括“漏斗影象”(ICCV 2007),LFW-a,其使用未發表的對齊方法和“深漏斗”影象(NIPS 2012)。 其中,LFW-a和深漏斗影象對於大多數面部驗證演算法而言比原始影象和漏斗影象(ICCV 2007)產生了優異的結果。

YouTube Video Faces:

用於人臉識別的資料集。該資料集包含3,425個1,595個不同的人的視訊。 最短剪輯持續時間為48幀,最長剪輯為6,070幀,視訊剪輯的平均長度為181.3幀。

在設計我們的視訊資料集和基準時,我們遵循“無約束人臉標記”LFW影象集的示例。具體來說,我們的目標是製作大規模的視訊集合以及指示每個視訊中出現的人的身份的標籤。 此外,我們還發布了基準測試,旨在衡量視訊對匹配技術在這些視訊上的表現。 最後,我們使用完善的描述符方法為這些視訊中出現的面部提供描述符編碼。 

CALTECH 101(加利福尼亞理工學院101類影象資料庫):

Caltech 101資料集由總共9146個影象組成,分為101個不同的物件類別,以及一個額外的背景/雜波類別。每個物件類別平均包含40到800個影象。常用和流行的類別(如面部)往往比較少使用的類別具有更多的影象。每個影象的尺寸約為300x200畫素。2003年9月,李菲菲,馬克安德烈託和Marc'Aurelio Ranzato收集。諸如飛機和摩托車的定向物體的影象被映象為左右對齊,並且諸如建築物的垂直定向結構被旋轉為離軸。

我們仔細標註了這些圖片中每個物件的輪廓,這些都包含在“Annotations.tar”中。

還有一個matlab指令碼來檢視註釋'show_annotations.m'。

Caltech 256(加利福尼亞理工學院256類影象資料庫):

一組具有挑戰性的256個類別的資料集,其中包含總共30607個影象。包括最初的Caltech-101資料集的內容。

影象收集的方式:選擇一種類別,從Google影象下載示例,然後手動篩選出不適合該類別的所有影象。

Caltech-256也以上面的方式收集,有幾處改進:

類別數量增加一倍以上,從101類增加到256類;

任何類別中影象的最小數量從31增加到80;

避免因影象旋轉造成的偽影;

引入了一個新的更大的雜波類別來測試背景拒絕。

MIT-67 indoor scenes:

這是一個室內場景的資料集,由於大多數在“戶外”場景中表現良好的場景識別模型在室內表現不佳,因而這個資料集非常有用。內有 67 個室內類別,共 15,620 張影象。每個類的影象數量在101-738之間。

我們可以使用它6700個影象的子集(每個類100個)進行訓練和測試。訓練集中每個類有80個影象。每個類別的剩餘20個影象被設定用於測試。

PASCAL VOC 2007:

一個用來做目標檢測的資料集。

一共有20個類,共9,963張影象,包含24,640個帶註釋的物件:

人:人

動物:鳥,貓,牛,狗,馬,羊

車輛:飛機,自行車,船,公共汽車,汽車,摩托車,火車

室內:瓶子,椅子,餐桌,盆栽,沙發,電視/顯示器

Adience dataset:

一個人臉性別的資料集。

照片總數: 26580 
人數: 2284 
年齡組數/標籤: 8(0-2,4-6,8-13,15-20,25-32,38-43,48-53,60 - )
性別標籤:

CIFAR-10:

CIFAR-10 是一個包含60000張圖片的資料集。其中每張照片為32*32的彩色照片,每個畫素點包括RGB三個數值,數值範圍 0 ~ 255。

所有照片分屬10個不同的類別,分別是 'airplane', 'automobile', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck'

其中五萬張圖片被劃分為訓練集,剩下的一萬張圖片屬於測試集。

Microsoft Common Objects in Context(COCO)資料集:

該資料集主要有的特點如下:

物件分割;

在背景下的認可;

超畫素的東西分割;

330K影象(> 200K標記);

150萬個物件例項;

80個物件類別;

91個東西類別;

每張圖片5個字幕;

250,000個有關鍵點的人。