YOLOV3 將自己的txt轉為XML，再將XML轉為符合YOLO要求的txt格式

阿新 • • 發佈：2019-01-08

我自己的資料集格式為filename lable xmin ymin xmax ymax

1 通過別的模板轉換

VOC資料集的xml格式為：

<annotation>
  <folder>VOC2007</folder>
  <filename>000002.jpg</filename>    //檔名  
  <size>                            //影象尺寸（長寬以及通道數
    <width>335</width>
    <height>500</height>
    <depth 
>3</depth>
  </size>
  <object>        //檢測到的物體
    <name>cat</name>    //物體類別
    <pose>Unspecified</pose>    //拍攝角度
    <truncated>0</truncated>    //是否被截斷（0表示完整
    <difficult>0</difficult>    //目標是否難以識別（0表示容易識別）
    <bndbox>                    //bounding-box（包含左下角和右上角xy座標） 

      <xmin>139</xmin>
      <ymin>200</ymin>
      <xmax>207</xmax>
      <ymax>301</ymax>
    </bndbox>
  </object>
</annotation>

所以我們把它當作模板然後修改成自己的資料集。注意object 可能不止一個。

轉換程式碼：

import copy
from lxml.etree import Element, SubElement, tostring, ElementTree
import  
cv2

# 修改為你自己的路徑
template_file = 'G:\\dataset\\WJ-data\\anno.xml'
target_dir = 'G:\\dataset\\WJ-data\\Annotations\\'
image_dir = 'G:\\dataset\\train\\'  # 圖片資料夾
train_file = 'G:\\dataset\\train.txt'  # 儲存了圖片資訊的txt檔案
with open(train_file) as f:
    trainfiles = f.readlines()  # 標註資料 格式(filename label x_min y_min x_max y_max)
file_names = []
tree = ElementTree()

for line in trainfiles:
    trainFile = line.split()
    file_name = trainFile[0]
    print(file_name)

    # 如果沒有重複，則順利進行。這給的資料集一張圖片的多個框沒有寫在一起。
if file_name not in file_names:
        file_names.append(file_name)
        lable = trainFile[1]
        xmin = trainFile[2]
        ymin = trainFile[3]
        xmax = trainFile[4]
        ymax = trainFile[5]

        tree.parse(template_file)
        root = tree.getroot()
        root.find('filename').text = file_name

        # size
sz = root.find('size')
        im = cv2.imread(image_dir + file_name)#讀取圖片資訊
sz.find('height').text = str(im.shape[0])
        sz.find('width').text = str(im.shape[1])
        sz.find('depth').text = str(im.shape[2])

        # object 因為我的資料集都只有一個框
obj = root.find('object')

        obj.find('name').text = lable
        bb = obj.find('bndbox')
        bb.find('xmin').text = xmin
        bb.find('ymin').text = ymin
        bb.find('xmax').text = xmax
        bb.find('ymax').text = ymax
        # 如果重複，則需要新增object框
else:
        lable = trainFile[1]
        xmin = trainFile[2]
        ymin = trainFile[3]
        xmax = trainFile[4]
        ymax = trainFile[5]

        xml_file = file_name.replace('jpg', 'xml')
        tree.parse(target_dir + xml_file)#如果已經重複
root = tree.getroot()

        obj_ori = root.find('object')

        obj = copy.deepcopy(obj_ori)  # 注意這裡深拷貝
obj.find('name').text = lable
        bb = obj.find('bndbox')
        bb.find('xmin').text = xmin
        bb.find('ymin').text = ymin
        bb.find('xmax').text = xmax
        bb.find('ymax').text = ymax
        root.append(obj)

    xml_file = file_name.replace('jpg', 'xml')
    tree.write(target_dir + xml_file, encoding='utf-8')

2.將xml轉為符合YOLO的txt

標註檔案.txt裡的資料格式是這樣的：

轉換程式碼如下:

# box裡儲存的是ROI感興趣區域的座標（x，y的最大值和最小值）
# 返回值為ROI中心點相對於圖片大小的比例座標，和ROI的w、h相對於圖片大小的比例
def convert(size, box):
    dw = 1./(size[0])
    dh = 1./(size[1])
    x = (box[0] + box[1])/2.0
    y = (box[2] + box[3])/2.0
    w = box[1] - box[0]
    h = box[3] - box[2]
    x = x*dw
    w = w*dw
    y = y*dh
    h = h*dh
    return (x, y, w, h)


# 對於單個xml的處理
def convert_annotation(image_add):
    # image_add進來的是帶地址的.jpg
    #image_add = os.path.split(image_add,' ')[1]  # 擷取檔名
    image_name = image_add.split()[0]
    print(image_name)
    image_name = image_name.replace('.jpg', '')  # 刪除字尾，現在只有檔名
    in_file = open('G:\\dataset\\WJ-data\\Annotations\\' + image_name + '.xml')  # 圖片對應的xml地址
    out_file = open('G:\\dataset\\WJ-data\\labels\\%s.txt' % (image_name), 'w')

    tree = ET.parse(in_file)
    root = tree.getroot()

    size = root.find('size')

    w = int(size.find('width').text)
    h = int(size.find('height').text)

    # 在一個XML中每個Object的迭代
    for obj in root.iter('object'):
        # iter()方法可以遞迴遍歷元素/樹的所有子元素
        difficult = obj.find('difficult').text
        cls = obj.find('name').text
        # 如果訓練標籤中的品種不在程式預定品種，或者difficult = 1，跳過此object
        if cls not in classes or int(difficult) == 1:
            continue
        cls_id = classes.index(cls)#這裡取索引，避免類別名是中文，之後執行yolo時要在cfg將索引與具體類別配對
        xmlbox = obj.find('bndbox')

        b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(
            xmlbox.find('ymin').text), float(xmlbox.find('ymax').text))
        bb = convert((w, h), b)
        out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')


if not os.path.exists('G:\\dataset\\WJ-data\\labels\\'):#不存在資料夾
    os.makedirs('G:\\dataset\\WJ-data\\labels\\')

image_adds = open("G:\\dataset\\train.txt")
for image_add in image_adds:
    image_add = image_add.strip()
    convert_annotation(image_add)

print("Finished")

3.構建訓練集與交叉驗證集:

"""
分割訓練集和驗證集
分別儲存了圖片的路徑
"""
from sklearn.model_selection import train_test_split

img_add = 'G:\\dataset\\train.txt'
data_set = [x.strip() for x in open(img_add).readlines()]

train_X, test_X = train_test_split(data_set, test_size=0.2, random_state=0)
print(train_X)
print(test_X)

train_file = open('G:\\dataset\\WJ-data\\train_file.txt', 'w')
for x in train_X:
    x = x.split(' ')[0]
    print(x)
    train_file.write('G:\\dataset\\train'+x+'\n')

test_file = open('G:\\dataset\\WJ-data\\valid_file.txt', 'w')
for x in test_X:
    x = x.split(' ')[0]
    test_file.write('G:\\dataset\\train'+x+'\n')

4. 生成類別名檔案:

with open('G:\\dataset\\WJ-data\\obj.names', 'w') as f:
    for i in range(61):
        f.write(str(i)+'\n')

參考連結：

YOLOV3 將自己的txt轉為XML，再將XML轉為符合YOLO要求的txt格式

我自己的資料集格式為filename lable xmin ymin xmax ymax1 通過別的模板轉換VOC資料集的xml格式為：<annotation> <folder>VOC2007</folder> <filena

springboot使用HttpClient接受json引數轉為物件，再將物件轉為json

將json資料轉為物件模型http://wthrcdn.etouch.cn/weather_mini?city=深圳上面連結可以請求天氣資料，並返回json：{ "data": { "yesterday": { "date":

將UIBezierPath存為自定義格式的字串，再將字串轉為UIBezierPath

<pre name="code" class="objc">自定義字串格式為：@"123.02,234.23|321.23,432.0002|543.0003,432.0045|654.0034,567.0034|23.3443,56.0034|77.3440,

生成簽名，隨機字串，XML轉為陣列，陣列轉XML，json封裝，獲取IP地址

/* * ******生成簽名********* */private function getSign($params){ ksort($params); //將引數陣列按照引數名ASCII碼從小到大排序 foreach ($params as $key => $item) {

java實現反編譯apk，並修改AndroidManifest.xml，再生成apk的工具

因為公司要求，需要弄一個能夠修改AndroidManifest.xml二進位制檔案內容的工具。該工具需要實現修改AndroidManifest.xml中標籤屬性值的功能。目前bug還有不少，後面會慢慢完善的。工具功能說明： 1.解壓apk安裝包，獲得androidMan

加密演算法：資料是四位的整數對其加密規則如下：每位數字都加上5,然後用和與10求餘後的餘數代替該數字，再將第一位和第四位交換，第二位和第三位交換，計算加密後的整數。

程式碼如下： import java.util.Scanner; public class ji { public static void main(String[]args){ Scanner s=new Scanner(System.in); System.

將圖片寫入二進位制檔案，再從二進位制檔案還原圖片(c++)

1 #include "string" 2 #include "iostream" 3 #include "fstream" 4 using namespace std; 5 #define MAX 20480 6 void main() 7 { 8 string sPicPat

【程式29】 TestAdd3.java 題目：求一個3*3矩陣對角線元素之和 1.程式分析：利用雙重for迴圈控制輸入二維陣列， //再將a[i][i]累加後輸出。

//【程式29】 TestAdd3.java 題目：求一個3*3矩陣對角線元素之和 1.程式分析：利用雙重for迴圈控制輸入二維陣列， //再將a[i][i]累加後輸出。 public class TestAdd3App { /** * @param args

組合語言學習之路（7）------------輸入10進位制數，將其轉換為2進位制數,存放在ax中，再將其轉換為ASCII碼並輸出

data segment inf1 db "please input a number(1-361):$" ibuf db 7,0,6 dup(0) obuf db 6 dup(0) data ends c

js 計算出兩個時間戳之間的間隔時間，再將間隔時間倒計時

現在有這樣一個需求，前端播下一個種子，後臺給你返回兩個時間戳，第一個是你播種時的時間戳，第二個是種子發芽成熟之後的時間戳。然後讓你計算種子成熟的倒計時。 JavaScript 獲取當前時間戳：第一種方法： var timestamp = Date.pars

兩個檔案合併成一個二進位制檔案，再將這兩個檔案還原

問題：在做專案的時候，winform輔助工具生成了一個資料夾，裡面包含兩個檔案，然後再把這兩個檔案分別上傳到webform裡面，這樣子就顯得複雜而且容易出錯。本來想的是把這兩個檔案壓縮成一個壓縮包，但是給的類庫有點大，最終選擇寫成一個二進位制檔案，接著上傳這個二進位制。這需要

題目：某個公司採用公用電話傳遞資料，資料是四位的整數，在傳遞過程中是加密的，加密規則如下：每位數字都加上5,然後用和除以10的餘數代替該數字，再將第一位和第四位交換，第二位和第三位交換。

題目：某個公司採用公用電話傳遞資料，資料是四位的整數，在傳遞過程中是加密的，加密規則如下：每位數字都加上5,然後用和除以10的餘數代替該數字，再將第一位和第四位交換，第二位和第三位交換。package

【程式48】題目：某個公司採用公用電話傳遞資料，資料是四位的整數，在傳遞過程中是加密的，加密規則如下：每位數字都加上5, 然後用和除以10的餘數代替該數字，再將第一位和第四位交換，第二位

/* 2017年3月13日11:46:14 java基礎50道經典練習題例48 Athor: ZJY Purpose: 【程式48】題目：某個公司採用公用電話傳遞資料，資料是四位

python中，如何將多行進行輸出，同時將行尾的換行符去掉

需求說明：　　比如我要輸出字串的常量，字串常量要輸出多行，該怎麼解決呢操作過程： 1.可以通過三引號（""" .... """）將要輸出的內容擴起來 >>> print(""" Usage: thingy [OPTIONS] -h

2.SpringMVC+Spring+Mybatis整合（2）配置web.xml，spring-servlet.xml，applicationContext.xml

web spring-servlet 在 webapp WEB-INF下 applicationContext 在resource資料夾下 <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:

dom4j 建立縮排換行格式的xml，並輸出xml到字串中

public void createXML() { // 建立XML文件樹 Document document = DocumentHelper.createDocument(); // 建立根節點

Mysql 將表結構匯入 Powerdesigner ，並將註釋作為 name 列

步驟一：安裝MYSQL的ODBC驅動 Connector/ODBC 5.1.10 下載地址：選擇win-32 MIS安裝包，進行直接安裝就可以了。步驟二：配置OBDC驅動連線步驟三：開啟PowerDesigner ： 1)檔案->新建

android webservice通過soap協議返回XML，如何解析XML

返回的結果中<success>為true時，返回<datatable>中的資訊。false時，返回<message>中的資訊 <datatable>中的資料形式： <nochecklist> <iRecNo

Oracle將時分秒轉換為秒再計算平均值後轉回時分秒格式

1.將時分秒轉為數值型的秒，再求平均值 AVG(to_number(to_char(to_date(total_time,'HH24:mi:ss'),'sssss'))) 2.將平均值轉回成時分秒格式： to_char(trunc(sysdate,'dd') + 秒

將100道計算題輸出至txt檔案，再讀取檔案至控制檯,在控制檯中輸入答案並評判對錯

我在課堂上基本完成了輸出100道題和建立文件，但是因為對輸入輸出流不熟悉，所以並沒有實現將輸出的計算題匯出到文件裡，在課下我又請教了宿舍的大佬，基本完成如下：原始碼： import java.io.File; import java.io.FileInputStream; import java.

YOLOV3 將自己的txt轉為XML，再將XML轉為符合YOLO要求的txt格式

1 通過別的模板轉換

相關推薦