【tensorflow】Object DetectionAPI訓練識別自己的資料集

阿新 • • 發佈：2018-12-05

#一、資料準備
###1.一個友好的標註工具
各種系統安裝已經再此介紹的很詳細了，linux下可以三行命令解決。

注意：圖片要求是png或者jpg格式

1> . 標註資訊存為xml檔案，使用該指令碼可以將所有的xml檔案轉換為1個csv檔案（自行修改xml路徑）
2> . 把生成的csv檔案分成訓練集和測試集
###2.生成TFRecord檔案
使用該指令碼分別生成train.record 和 test.record.
記得修改其中三處路徑，以及分類標識資料型別（中文有註釋），分兩次執行哦！
#二、環境搭建
###1.tensorflow 版本 >= 1.4.0
具體的安裝，自行百度
###2.部署tensorflow model
1> . 從這裡下載下

整個models，解壓，假設放在了A目錄下；
注意：下文中的A 都表示下載的model檔案的目錄位置
2> . 這一步分linux和window介紹

------------------------------------------------linux開始----------------------------------------------------
進入A/models/research/目錄，右鍵開啟終端，執行
protoc object_detection/protos/*.proto --python_out=.　　　　　　
新增slim和models/research路徑，相當於環境變數
gedit ~/.bashrc

在該檔案末，新增：
export PYTHONPATH=$PYTHONPATH:/A/models/research/slim:/A/models/research/
更新檔案
source ~/.bashrc

------------------------------------------------linux以上結束----------------------------------------------------

------------------------------------------------window開始-----------------------------------------------------
下載

protoc-3.3.0-win32.zip
解壓後，執行一下protoc.exe檔案
開啟cmd視窗，cd到A/models/research/目錄下(老版本沒有research目錄)，執行如下:
protoc object_detection/protos/*.proto --python_out=.
將生成一堆python檔案
然後為python新增預設模組搜尋路徑三種方式
本人選擇的第三種，增加.pth檔案
在site-packages新增一個路徑檔案，如mypkpath.pth，必須以.pth為字尾，寫上你要加入的模組檔案所在的目錄名稱，也就是下面兩行：
A\models\research A\models\research\slim
然後儲存為了.pth檔案，名字隨意選，然後放在Python執行能掃描到的地方，我放在了python下的lib下的site-packages裡，因為python執行一定會經過這裡。
------------------------------------------------window以上結束-----------------------------------------------------

3> . 兩個系統都必須經過這一步
測試安裝，進入到A/models/research/目錄下，執行

python  object_detection/builders/model_builder_test.py

如果發現前方有坑：

Traceback (most recent call last):
  File "object_detection/builders/model_builder_test.py", line 21, in <module>
    from object_detection.builders import model_builder
ImportError: No module named 'object_detection'

說明前邊模組檔案路徑配置沒有成功。
#三、訓練自己的資料
###1.下載模型
模型地址
選擇其中的下載
###2.建立標籤分類的配置檔案(label_map.pbtxt)

item {
  id: 1 # id一定要從1開始編號
  name: 'syjxh'
}

item {
  id: 2
  name: 'dnb'
}

放在一個位置就好
###3.修改對應的pipline配置檔案
找到\object_detection\samples\configs\XXXXXXXXXXX.config檔案，XXXXXXXXXXX需要和你下載的模型一致的配置檔案，複製到\test\data資料夾下，修改一下幾處：

# ====修改 1=====
num_classes:2    # 根據你的目標分類來，我這裡一共標記了6種物件
# ====修改 2=====
# 因為我們是重新訓練模型，所以這裡註釋掉模型檢測點，並將from_detection_checkpoint該為false
# fine_tune_checkpoint: "PATH_TO_BE_CONFIGURED/model.ckpt"  
  from_detection_checkpoint: false
  num_steps: 200000  # 訓練次數
# ====修改 3=====
train_input_reader: {
  tf_record_input_reader {
    # 訓練樣本路徑
    input_path: "A/models/test/data/train.record" 
  }
  # 標籤分類配置檔案路徑
  label_map_path: "A/models/test/label_map.pbtxt"
}

# ====修改 4=====
eval_input_reader: {
  tf_record_input_reader {
    # 驗證樣本路徑
    input_path: "A/models/test/data/eval.record"
  }
   # 標籤分類配置檔案路徑
  label_map_path: "A/models/test/label_map.pbtxt"
  shuffle: false
  num_readers: 1
}

###4.開始訓練啦！！！！
直接使用object_detection\train.py檔案進行訓練即可，引數如下：

--logtostderr
--pipeline_config_path=F:/TensorFlow/models/test/data/ssd_inception_v2_pets.config
--train_dir=F:/TensorFlow/models/test/training

配置好引數後，直接run起來，接下來就是漫長的等待，訓練過程中可以使用eval.py檔案進行驗證。
目前我還沒跑出結果，截個圖給大家瞅瞅先！還在訓練中，估計跑一天。。。

這裡寫圖片描述

繼續補充結果

參考：
部落格1,
部落格2

【tensorflow】Object DetectionAPI訓練識別自己的資料集

【tensorflow】Object DetectionAPI訓練識別自己的資料集

【opencv3--ANN神經網路訓練識別OCR資料集】

【TensorFlow】多GPU訓練：示例程式碼解析

【TensorFlow】PyCharm中無法識別tensorflow、numpy等Python庫問題的解決辦法

【NLP】【八】基於keras與imdb影評資料集做情感分類

【keras】解決 example 案例中 MNIST 資料集下載不了的問題

【TensorFlow】Win7下使用Object Detection API 訓練自己的資料集，並視訊實時檢測

TensorFlow使用object detection訓練並識別自己的模型

【轉載】 Faster-RCNN+ZF用自己的數據集訓練模型(Matlab版本)

【TensorFlow】3-2構建簡單單層神經網路進行【手寫字元識別】

【YOLO初探】之 keras-yolov3訓練自己資料集

【心得】深度學習入門——訓練並測試自己資料集

【caffe】使用caffe訓練自己的資料

【轉載】細粒度影象識別Object-Part Attention Driven Discriminative Localization for Fine-grained Image Classification

【Tensorflow】怎樣為你的網路預加工和打包訓練資料？（一）

【Tensorflow】怎樣為你的網路預加工和打包訓練資料？（二）：小資料集的處理方案

【Tensorflow】寫給初學者的深度學習教程之 MNIST 數字識別

【TensorFlow】從訓練好的模型中獲取引數值

【Maven】1.使用myecplise配置自己的Maven配置，不使用默認的maven

【tensorFlow】tf.reshape()報錯信息 - TypeError: Expected binary or unicode string

【tensorflow】Object DetectionAPI訓練識別自己的資料集

相關推薦