pytorch載入pascal&&coco資料集

阿新 • • 發佈：2018-12-23

上一篇部落格https://blog.csdn.net/goodxin_ie/article/details/84315458我們詳細介紹了pascal&&coco資料集，本篇我們將介紹pytorch如何載入

一、目標

pascal資料集的資料來源是jpg圖片，便籤是xml檔案，而pytorch運算使用的資料是Tensor。因此我們的目標是將jpg和xml檔案轉化為可供程式運算使用的Tensor或者numpy型別（Tesnor和numpy可以相互轉化）。

回憶一下目標檢測演算法需要的標籤資訊，有類別和bbox框。在pascal資料集中，每張圖片中的物件由xml中的objec標定，每個物件存在類別名name，位置框('ymin', 'xmin', 'ymax', 'xmax')，是否為困難樣本的標記difficult。

二、解析xml檔案

呼叫ElementTree元素樹可以很方便的解析出xml檔案的各種資訊。我們主要使用其中的find方法查詢對應屬性的資訊

ET.findall('object')   #查詢物件
ET.findall('bndbox')   #查詢位置框

完整的解析pasacal中xml檔案程式碼如下：

輸入引數：路徑，檔名，是否使用困難樣本

輸出： bbox，label，difficult （型別np.float32）

def parseXml(data_dir,id,use_difficult=False):
        anno = ET.parse(
            os.path.join(data_dir, 'Annotations', id + '.xml'))
        bbox = list()
        label = list()
        difficult = list()
        for obj in anno.findall('object'):
            if not use_difficult and int(obj.find('difficult').text) == 1:
                continue
            difficult.append(int(obj.find('difficult').text))
            bndbox_anno = obj.find('bndbox')

            bbox.append([
                int(bndbox_anno.find(tag).text) - 1
                for tag in ('ymin', 'xmin', 'ymax', 'xmax')])
            name = obj.find('name').text.lower().strip()
            label.append(VOC_BBOX_LABEL_NAMES.index(name))
        bbox = np.stack(bbox).astype(np.float32)     #from list to array
        label = np.stack(label).astype(np.int32)

        difficult = np.array(difficult, dtype=np.bool).astype(np.uint8)  # PyTorch don't support np.bool
        return  bbox, label, difficult

pytorch載入pascal&&coco資料集

pytorch載入pascal&&coco資料集

Pascal VOC & COCO資料集介紹

Kmeans&HCA + iris資料集+python實現

Pytorch學習筆記（二）自己載入單通道圖片用作資料集訓練

COCO資料集的標註格式

處理coco資料集-語義分割

COCO資料集格式互換

使用pytorch版faster-rcnn訓練自己資料集

==3==基於tensorflow目標識別API執行已有的模型(執行demo coco資料集)

Ubuntu 16.04系統Microsoft Common Objects in Context(COCO)資料集在Python環境中的使用

如何使用COCO資料集api評估特定類別的AP

怎麼把 PASCAL VOC 2007 / 2012 資料集轉換成LMDB格式

COCO資料集做語義分割

使用coco資料集，faster rcnn類方法訓練出錯解決

MS COCO資料集介紹

Faster-R-CNN（Python）.2：COCO資料集annotation內容

COCO資料集的一點點理解

COCO資料集擴充套件的幾個關鍵點

MS COCO資料集目標檢測評估（Detection Evaluation）（來自官網）

驗證性試驗：yolov3訓練coco資料集

pytorch載入pascal&&coco資料集

相關推薦