SSD-Tensorflow 目標檢測（自定義資料集（VOC2007格式））

阿新 • • 發佈：2018-12-16

一、準備

搭建SSD框架，下載解壓即可
下載pascalvoc資料，自己的資料根據voc格式改寫（圖片的名稱，不用拘泥於6位數字，其他命名也可以）資料集下載點選
解壓後不要混合在一個資料夾下
VOCtrainval用來訓練，VOCtest用來測試。
VOCtrainval 中JPEGImage資料夾中僅是訓練和驗證的圖片，Main資料夾中僅是trainval.txt, train.txt, val.txt
VOCtest中JPEGImage資料夾中僅是測試圖片，Main資料夾中僅是test.txt
自己的檔案根據以上檔案格式放置圖片即可。
自己的資料根據voc格式改寫（圖片的名稱，不用拘泥於6位數字，其他命名也可以）

檔案重新命名點選
標記資料，這個過程枯燥，需要耐心。詳情請點選,
生成txt檔案，train.txt, trainval.txt, test.txt, val.txt

import os
import random

saveBasePath = r"./VOC007/ImageSets"              # txt檔案儲存目錄
total_xml = os.listdir(r'./VOC007/Annotations')   # 獲取標註檔案（file_name.xml）

# 劃分資料集為（訓練，驗證，測試集 = 49%,20%,30%）
trainval_percent = 
 0.7
train_percent = 0.7
tv = int(len(total_xml) * trainval_percent)       # 70%訓練-驗證集的檔案數目
tr = int(tv * train_percent)                      # 70%訓練集的檔案數目

# 打亂訓練檔案（洗牌）
trainval = random.sample(range(len(total_xml)), tv)
train = random.sample(trainval, tr)

print("train and val size", tv)
print("train size" 
, tr)
ftrainval = open(os.path.join(saveBasePath, 'Main/trainval.txt'), 'w')
ftest = open(os.path.join(saveBasePath, 'Main/test.txt'), 'w')
ftrain = open(os.path.join(saveBasePath, 'Main/train.txt'), 'w')
fval = open(os.path.join(saveBasePath, 'Main/val.txt'), 'w')

for i in range(len(total_xml)):                # 遍歷所有 file_name.xml 檔案
    name = total_xml[i][:-4] + '\n'            # 獲取 file_name
    if i in trainval:
        ftrainval.write(name)
        if i in train:
            ftrain.write(name)
        else:
            fval.write(name)
    else:
        ftest.write(name)

ftrainval.close()
ftrain.close()
fval.close()
ftest.close()

將train.txt, trainval.txt, test.txt, val.txt放置訓練驗證集檔案目錄下
VOCtrainval_06-Nov-2007\VOCdevkit\VOC2007\ImageSets\Main\
將test.txt放置測試集檔案目錄下：
VOCtest_06-Nov-2007\VOCdevkit\VOC2007\ImageSets\Main\

將訓練類別修改為和自己一樣的
在此目錄檔案下： SSD-Tensorflow/datasets/pascalvoc_common.py
根據實際情況進行修改

VOC_LABELS = {   
    'none': (0, 'Background'),   
    'aeroplane': (1, 'Vehicle'),   
    'bicycle': (2, 'Vehicle'),   
    'bird': (3, 'Animal'),   
    'boat': (4, 'Vehicle'),   
    'bottle': (5, 'Indoor'),   
    'bus': (6, 'Vehicle'),   
    'car': (7, 'Vehicle'),   
    'cat': (8, 'Animal'),   
    'chair': (9, 'Indoor'),   
    'cow': (10, 'Animal'),   
    'diningtable': (11, 'Indoor'),   
    'dog': (12, 'Animal'),   
    'horse': (13, 'Animal'),   
    'motorbike': (14, 'Vehicle'),   
    'Person': (15, 'Person'),   
    'pottedplant': (16, 'Indoor'),   
    'sheep': (17, 'Animal'),   
    'sofa': (18, 'Indoor'),   
    'train': (19, 'Vehicle'),   
    'tvmonitor': (20, 'Indoor'),   
}

將影象資料轉換為tfrecods格式
SSD-Tensorflow/datasets/pascalvoc_to_tfrecords.py 。
更改檔案的83行為:image_data = tf.gfile.FastGFile(filename, 'rb').read()
更改檔案的67行，SAMPLES_PER_FILES = 500(自定義)意為：幾個.xml轉為一個tfrecords，如下圖

待續

SSD-Tensorflow 目標檢測（自定義資料集（VOC2007格式））

一、準備搭建SSD框架，下載解壓即可下載pascalvoc資料，自己的資料根據voc格式改寫（圖片的名稱，不用拘泥於6位數字，其他命名也可以）資料集下載點選解壓後不要混合在一個資料夾下 VOCtrainval用來訓練，VOCtest用來測試。 VOCtrai

（12）自定義資料流（實戰Docker事件推送的REST API）——響應式Spring的道法術器

2.2 自定義資料流這一小節介紹如何通過定義相應的事件（onNext、onError和onComplete）建立一個 Flux 或 Mono。Reactor提供了generate、create、push和handle等方法，所有這些方法都使用 si

Hadoop系列-MapReduce自定義資料型別（序列化、反序列化機制）（十二）

Github程式碼下載地址：大家都知道，Hadoop中為Key的資料型別必須實現WritableComparable介面，而Value的資料型別只需要實現Writable介面即可；能做Key的一定可以做Value，能做Value的未必能做Key。但是具體應該怎麼應

WebApi資料驗證——編寫自定義資料註解（Data Annotations）

配合ModelState使用，關於使用方法，參考微軟文件 https://docs.microsoft.com/en-us/as

大資料（hadoop-自定義資料型別、檔案格式）

自定義InputFormat OutputFormat 示例程式碼 package com.vip09;

JSP編程專題2之JSP核心三（自定義EL函數和標簽）

自定義el函數 jstl中的el函數自定義el標簽自定義帶屬性的el標簽自定義el遍歷標簽 1、自定義EL函數：a、自定義類，類中的方法使用static修飾符修飾：b、該類以及函數，需要在一個擴展名為.tld（tld，tag library definition，標簽庫定義）的XML

深度學習之TensorFlow使用CNN測試Cifar-10資料集（Python實現）

題目描述： 1. 對Cifar-10影象資料集，用卷積神經網路進行分類，統計正確率。 2.選用Caffe, Tensorflow, Pytorch等開源深度學習框架之一，學會安裝這些框架並呼叫它們的介面。 3.直接採用這些深度學習框架針對Cifar-10資料集已訓練好的網路模型，只

sklearn 學習實踐之——基於自帶資料集（波士頓房價、鳶尾花、糖尿病等）構建分類、迴歸模型

只要是接觸機器學習的，很少有沒聽過sklearn的，這個真的可以稱得上是機器學習快速進行的神器了，在研究生的時候搭建常用的機器學習模型用的就是sklearn，今天應部門的一些需求，簡單的總結了一點使用方法，後面還會繼續更新，今天僅使用sklearn自帶的資料

Pytorch 神經網路—自定義資料集上實現

第一步、匯入需要的包 import os import scipy.io as sio import numpy as np import torch import torch.nn as nn import torch.backends.cudnn as cudnn im

潤乾報表設計器中使用 spring 框架實現自定義資料集

spring是一個開源框架，是為了解決企業應用程式開發複雜性而建立的。在 web 開發環境中經常會與 struts、hibernate聯合起來使用，進行規範的框架結構開發。潤乾中的二次開發也可以與 SSH 框架相結合部署到 web 專案中。本文介紹在設計時沒有啟動 web 服務，在設計器中使用 sp

CNN-中文文字分類-開源專案-自定義資料集

最近參加學校的一個數據分析比賽，因為自己前面自學了一些基本的機器學習演算法，但其實還處於入門階段，便參加了。選擇了一道中文文字分類的題目。今日頭條使用者畫像選題背景：隨著機器創作能力越來越強，今後社會媒體上將會產生越來越多的機器創作者自動生產的內容。有效

android 自定義dialog的實現（自定義大小、去除黑色邊框等）

搜尋相關關鍵字網上一大堆實現，但是看完總覺得缺胳膊少腿，繞了不少彎路，終於弄好了自定義dialog。把自己整合的完整程式碼發上來。要點： 1、設定自定義dialog的佈局檔案my_dialog.xml 2、設定一份自定義的樣式檔案styles_wx.xml，該檔案用於覆

目標檢測(Object Detection)演算法合集（

Object Detection This is a list of awesome articles about object detection. R-CNN Fast R-CNN Faster R-CNN Light-Head R-CNN Casca

基於tensorflow 批量修改自己的圖片資料集（附程式碼）

現在網上有很多關於Deeplearning的教程，不過這些教程的資料集都是已經做好的，並且格式名字什麼的都已經整理好了。特別是很多入門的教程都是Mnist 的資料集，這都已經非常的完善了。不過對於想自己製作資料集的小白來說，如何將自己收集的圖片批量轉換為自己需要

win10 tensorflow faster rcnn訓練自己的資料集（一、製作VOC2007資料集）

參考部落格：http://blog.csdn.net/gaohuazhao/article/details/60871886 一、關於VOC資料集： 1)JPEGImages資料夾資料夾裡包含了訓練圖片和測試圖片，混放在一起 2)Annatations資料夾資

darknet yolov3 訓練自定義資料集

VOC資料集上的訓練步驟修改類別 yolo層的classes修改成新的類別書 yolo層前一個convolution層的filters修改成(classes+4+1)*3 修改data檔案中的類別數目訓練 ./darknet detect

jquery_trigger() 2個用法（自定義事件和觸發2個作用）

jquery的trigger函式用的好，可以節省很多時間。我覺得trigger有2個用法，還是比較實用的，一個是自定議事件，一個是最基本的觸發。請看下面例項： <html> <h

關於SpringBoot的application.yml的相關配置（自定義，開發，測試，正式）切換

spring boot遵循“約定優於配置”的原則，使用annotation對一些常規的配置項做預設配置，減少或不使用xml配置，讓你的專案快速執行起來。spring boot的神奇不是藉助程式碼的生成來實現的，而是通過條件註解來實現的。1.自定義配置，我們用yml配置我們自己

MySQL8.0 For Windows 安裝教程（自定義配置檔案、密碼方式修改）

下載zip安裝包：　　MySQL8.0 For Windows zip包下載地址：https://dev.mysql.com/downloads/file/?id=476233，進入頁面後可以不登入。後點擊底部“No thanks, just start my downl

潤乾報表中API自定義資料集

報表的資料來源大部分來自資料庫，正常情況潤乾報表都能自動處理，但是也會有特殊的情況，例如通過中介軟體連線資料庫而非直連？通過業務程式算出的資料傳遞給報表進行展現等等。因此需要使用者自定義資料集，我們看一個例子。新建一個類檔案，在類檔案中寫如下程式碼： package t

SSD-Tensorflow 目標檢測（自定義資料集（VOC2007格式））

一、準備

相關推薦