資料集製作之txt轉xml

阿新 • • 發佈：2018-11-11

問題描述：

現有images圖片，txt檔案包含四種類別bounding box 座標，需要將txt中兩種類別座標提取出來並轉化成xml檔案。
images資料夾中有18184張圖片，txt資料夾中只有16907個txt檔案（即有一千多張圖片是沒有標註的，需要將這些圖片刪除）

# ! /usr/bin/python
# -*- coding:UTF-8 -*-
import os, sys
import glob
from PIL import Image
# 影象儲存位置
src_img_dir = "./1028data/images"
# 影象的 ground truth 的 txt 檔案存放位置
src_txt_dir = "./1028data/annotations"
# 生成xml檔案存放位置
src_xml_dir = "./1028data/xml"

img_Lists = glob.glob(src_img_dir + '/*.jpg')
img_basenames = []  # e.g. 100.jpg
for item in img_Lists:
    img_basenames.append(os.path.basename(item))
img_names = []  # e.g. 100
for item in img_basenames:
    temp1, temp2 = os.path.splitext(item)
    img_names.append(temp1)

for img in img_names:
    im = Image.open((src_img_dir + '/' + img + '.jpg'))
    width, height = im.size  #xml檔案中需要width和height資訊，這裡通過Image庫計算出來
    # open the corresponding txt file，由於圖片數量和txt數量不一致，所以對於有些圖片，沒有對應的txt檔案，所以這邊要用try
    try:
        gt = open(src_txt_dir + '/' + img + '.txt').read().splitlines() #把txt檔案裡每一行提取出來，我的txt有兩行
    except:
        continue  #跳過這次迴圈，進入下一張圖片迴圈

    # write in xml file
    # os.mknod(src_xml_dir + '/' + img + '.xml')
    xml_file = open((src_xml_dir + '/' + img + '.xml'), 'w')
    xml_file.write('<annotation>\n')
    xml_file.write('    <folder>VOC2007</folder>\n')
    xml_file.write('    <filename>' + str(img) + '.jpg' + '</filename>\n')
    xml_file.write('    <size>\n')
    xml_file.write('        <width>' + str(width) + '</width>\n')
    xml_file.write('        <height>' + str(height) + '</height>\n')
    xml_file.write('        <depth>3</depth>\n')
    xml_file.write('    </size>\n')

    # write the region of image on xml file
    num_obj = int(gt[0])
    print('num_obj: ',num_obj)
    # assert 0
    for i in range(num_obj):
        i += 1

        spt = gt[i].split(' ')  # 這裡如果txt裡面是以逗號‘，’隔開的，那麼就改為spt = img_each_label.split(',')。
       
        xml_file.write('    <object>\n')
        xml_file.write('        <name>' + str('pedestrian') + '</name>\n')  # 類別名稱,可以固定下來
        xml_file.write('        <pose>Unspecified</pose>\n')
        xml_file.write('        <truncated>0</truncated>\n')
        xml_file.write('        <difficult>0</difficult>\n')
        xml_file.write('        <bndbox>\n')
        xml_file.write('            <xmin>' + str(spt[1]) + '</xmin>\n')
        xml_file.write('            <ymin>' + str(spt[2]) + '</ymin>\n')
        xml_file.write('            <xmax>' + str(float(spt[3]) + float(spt[1])) + '</xmax>\n')
        xml_file.write('            <ymax>' + str(float(spt[4]) + float(spt[2])) + '</ymax>\n')
        xml_file.write('        </bndbox>\n')
        xml_file.write('    </object>\n')

        xml_file.write('    <object>\n')
        xml_file.write('        <name>' + str('headshoulder') + '</name>\n')  # 類別名稱
        xml_file.write('        <pose>Unspecified</pose>\n')
        xml_file.write('        <truncated>0</truncated>\n')
        xml_file.write('        <difficult>0</difficult>\n')
        xml_file.write('        <bndbox>\n')
        xml_file.write('            <xmin>' + str(spt[11]) + '</xmin>\n')
        xml_file.write('            <ymin>' + str(spt[12]) + '</ymin>\n')
        xml_file.write('            <xmax>' + str(float(spt[13]) + float(spt[11])) + '</xmax>\n')
        xml_file.write('            <ymax>' + str(float(spt[14]) + float(spt[12])) + '</ymax>\n')
        xml_file.write('        </bndbox>\n')
        xml_file.write('    </object>\n')
    xml_file.write('</annotation>')
    print('finish {}'.format(img))

將images資料夾中與txt不匹配的圖片刪去，遍歷txt資料夾，將對應的images複製到另一個資料夾中（這個方法有點笨）


# ! /usr/bin/python
# -*- coding:UTF-8 -*-
import os,shutil
import glob
from PIL import Image

src_img_dir = "./1028data/images"
#  影象的 ground truth 的 txt 檔案存放位置
src_txt_dir = "./1028data/annotations"
src_xml_dir = "./1028data/xml"
# 新的images資料夾
topath = './1028data/new'

xml_Lists = glob.glob(src_xml_dir + '/*.xml')
print(xml_Lists)

xml_basenames = []
for items in xml_Lists:
    xml_basenames.append(os.path.basename(items))
print(xml_basenames)

xml_names = []
for items in xml_basenames:
    temp1, temp2 = os.path.splitext(items)
    xml_names.append(temp1)
#
print('xml_names',xml_names)
for xml in xml_names:
    print('xml:',xml)
    # raw_img = Image.open(src_img_dir + '/' + xml + '.jpg')
    try:
        #raw_img = Image.open(src_img_dir + '/' + xml + '.jpg')
        #print('open {}'.format(raw_img))
        shutil.copy(src_img_dir + '/' + xml + '.jpg', topath + '/' +xml+ '.jpg')  #主要就是這句起復製圖片作用
    except:
        continue

資料集製作之txt轉xml

問題描述：現有images圖片，txt檔案包含四種類別bounding box 座標，需要將txt中兩種類別座標提取出來並轉化成xml檔案。 images資料夾中有18184張圖片，txt資料夾中只有16907個txt檔案（即有一千多張圖片是沒有標註的，需要將這些圖片刪除

資料集製作之xml檔案轉化為csv

# -*- coding: utf-8 -*- """ 將資料夾內所有XML檔案的資訊記錄到CSV檔案中 """ import os import glob import pandas as pd import xml.etree.ElementTree as ET os.chdir('

Faster R-CNN Tensorflow實現之資料集製作（2）--- xml檔案的讀寫修改

接著上一篇的文章繼續製作自己的資料集，由於需要將資料集弄成與VOC 2007資料集一樣的格式，需要自己手動標註資料，根據網上前輩的經驗，這裡使用了labelImg，版本用了windows_v1 .7.0，操作簡單方便。使用該軟體進行標註後將直接生成以與圖片名稱相同的.XML檔

論文Multi-Perspective Sentence Similarity Modeling with Convolution Neural Networks實現之資料集製作

1.資料集本文采用的是STS資料集，如下圖所示，包括所有的2012-2016年的資料，而all資料夾包含2012-2015的所有資料。每一個檔案的具體資料如下所示，每一行為一個三元組：<相似性得分，句子1，句子2>. 在實現時將all資料夾中的所有資料當作

製作VOC型別資料集，生成txt，生成lmdb

前言：資料樣式參照PASCALVOC 需要檔案連結：http://pan.baidu.com/s/1gfeHDMN 密碼：o7h0 連結：http://pan.baidu.com/s/1nve53Wd 密碼：jbtt 一：生成txt 1：蒐集圖片，或者視訊資料等，利用標註

Kitti資料集使用之坑

KITTI資料集簡介與使用： https://blog.csdn.net/solomon1558/article/details/70173223 接下來是我使用時遇到的坑：一、label檔案中ry的含義按照文件中圖示，ry應該是小車朝向和相機座標系z軸的夾角

VOC格式資料集製作

rename %% %圖片儲存路徑為： %E:\image\car %E:\image\person %car和person是儲存車和行人的資料夾 %這些資料夾還可以有多個， %放在image資料夾裡就行 %該程式碼的作用是將圖片名字改成000123.jp

VOC2007格式資料集製作

<div class="article-copyright"> 版權宣告：本文為博主原創文章，轉載需宣告出處。 http

關於資料集製作過程中對圖片的一些操作

#給圖片建立資料名稱列表: ls > list.txt 給當目錄下的圖片在當前目錄下一個名為list.txt的圖片名稱列表文字檔案 #在已建立圖片名稱列表文字檔案的前提下，給圖片增添型別號在圖片所在的資料夾下開啟終端，執行下列命令： sed -i “1

【pytorch】自定義讀取資料集，使用txt文字

使用txt文字讀入資料可以減少記憶體的需要，有時候自定義載入資料集是非常必要的，我下面的程式碼是針對影象的，並且帶有label的有監督的影象。先看程式碼： import numpy as np import os import torch.nn as nn from PIL import Ima

資料儲存方式之 TXT 文字

Java 操作檔案輸入流與輸出流，具體內容包括 File 類、檔案位元組流與字元流、緩衝流。最後以網路爬蟲實戰案例，講解其具體的使用方式。輸入流、輸出流簡介在 Java 中，流是從源到目的地的位元組的有序序列。Java 中有兩種基本的流——輸入流和輸出流。輸

資料結構-棧之二進位制轉十進位制和八進位制

棧滿則後進先出原則，我們可以利用此特性實現二進位制轉十進位制、二進位制轉八進位制、二進位制轉十六進位制等相關操作，廢話不多說，直接上程式碼。二進位制轉十進位制： // // Created by Administrator on 2018/5/28. // //二進

神坑警告！影象分割資料集SYNTHIA之標籤讀取

神坑警告！影象分割資料集SYNTHIA之標籤讀取神坑警告！影象分割資料集SYNTHIA之標籤讀取影象分割與SYNTHIA資料集簡介 SYNTHIA資料集影象分割標籤讀取神坑警告！影象分割資料集SYNTHIA之標

影象分割 | FCN資料集製作的全流程（影象標註）

一全卷積神經網路文章所有程式碼已上傳至github，覺得好用就給個star吧，謝謝深度學習影象分割（FCN）訓練自己的模型大致可以以下三步： 1.為自己的資料製作label； 2.將自己的資料分為train,val和test集； 3.仿照voc_lyaers.py編寫自己的輸入資料層。

caffe fcn資料集製作 -標籤

caffe下fcn資料集的製作：看過我上篇部落格的人，想必已經跑通了作者的fcn資料集，現在就是製作自己的資料集並進行訓練。其實不難，首先我們分析一下作者的資料集。根據他的資料集，模仿一個即可。首先我們看作者訓練時需要的兩個資料集voc和dataset(這裡我的voc，我自己改了名字叫做voc2016)：

MXNET資料集製作，生成rec檔案

https://github.com/apache/incubator-mxnet/blob/master/tools/im2rec.py （一）製作rec資料集（1）下載im2rec.py 檔案（2）python im2rec.py train 檔案地址（內部按類別分成不同的資料夾）

ubuntu 使用yolov3 yolo-tiny-v3 基於cudnn 7.1 + cuda 9.1 + opencv 3.4.0 以及yolo資料集製作

1.我在Ubuntu官網上直接下載並安裝ubuntu ，顯示卡使用的gtx10702.在nvidia官網家上下載cuda9.1 runtime ubuntu16.04版本3.下載cudnn7.1 (需要註冊)4.在opencv官網上下載opencv3.4.0 原始碼5.在nv

利用Darket 和YOLOV3訓練自己的資料集(製作VOC)

1. 配置Darknet 下載darknet原始碼：git clone https://github.com/pjreddie/darknet 進入darknet目錄： cd darknet 如果是cpu直接make,否則需要修改Makefile，設

Tensorflow框架下Faster-RCNN實踐（一）——Faster-RCNN所需資料集製作（附程式碼）

最近剛實現了在Ubuntu16.04、Tensorfllow1.0下 Faster R-CNN 從資料製作到訓練再到利用生成的模型檢測的測試圖片的全過程，現在將具體的過程記錄在部落格，方便遇到困惑或者需要的朋友檢視。製作資料集利用Fast

tensorflow資料集製作/檔案佇列讀取方式

3種資料讀取方式 TensorFlow程式讀取資料一共有3種方法: 供給資料(Feeding)：在TensorFlow程式執行的每一步，讓Python程式碼來供給資料。從檔案讀取資料：在TensorFlow圖的起始，讓一個輸入管線從檔案中讀取資料

資料集製作之txt轉xml

問題描述：

將images資料夾中與txt不匹配的圖片刪去，遍歷txt資料夾，將對應的images複製到另一個資料夾中（這個方法有點笨）

相關推薦