caffe模型訓練全過程（一）指令碼、資料準備與製作

阿新 • • 發佈：2018-12-01

1.首先建立工程資料夾

資料夾結構如下

|——project
    ├── create_imagenet.sh  #生成lmdb檔案的指令碼
    |——train_lmdb
        ├── data.mdb
        └── lock.mdb            #存放輸出的訓練集lmdb檔案
    |——val_lmdb
        ├── data.mdb\
        └── lock.mdb            #存放輸出的測試集lmdb檔案
    ├── models              #存放輸出的模型
        ├── solver_iter_2576.caffemodel 

        └── solver_iter_2576.solverstate
    ├── other               #其他備份檔案
    ├── solver.prototxt         #solver配置檔案
    ├── train                   #測試資料集
        ├── positivite          l#存放類別1的圖片
        └── negative_eg     #存放類別2的圖片
    ├── train_caffenet.sh       #執行此指令碼開始訓練
    ├── train.txt 
               #存放訓練集路徑集合
    ├── train_val.prototxt      #caffe模型結構配置檔案
    ├── val                 #測試集資料
    └── val.txt             #測試訓練圖片

2.製作LMDB資料來源

首先生成train.txt and val.txt兩個包含路徑的文字檔案

其如下：

train.txt

positivite/IMG_000001.jpg 1
positivite/IMG_000002.jpg 1
positivite/IMG_000003.jpg 1
positivite/IMG_000008.jpg 
 1
positivite/IMG_000010.jpg 1
positivite/IMG_000014.jpg 1
positivite/IMG_000016.jpg 1
positivite/IMG_000017.jpg 1
positivite/IMG_000018.jpg 1
positivite/IMG_000020.jpg 1
positivite/IMG_000022.jpg 1
positivite/IMG_000023.jpg 1
positivite/IMG_000026.jpg 1
positivite/IMG_000028.jpg 1
positivite/IMG_000029.jpg 1
positivite/IMG_000031.jpg 1
positivite/IMG_000032.jpg 1
positivite/IMG_000037.jpg 1
positivite/IMG_000039.jpg 1
positivite/IMG_000040.jpg 1
positivite/IMG_000042.jpg 1
positivite/IMG_000044.jpg 1
.....................

val.txt
positivite/IMG_000162.jpg 1
positivite/IMG_000164.jpg 1
positivite/IMG_000165.jpg 1
positivite/IMG_000167.jpg 1
positivite/IMG_000168.jpg 1
positivite/IMG_000170.jpg 1
positivite/IMG_000171.jpg 1
positivite/IMG_000174.jpg 1
positivite/IMG_000177.jpg 1
positivite/IMG_000179.jpg 1
positivite/IMG_000180.jpg 1
positivite/IMG_000184.jpg 1
positivite/IMG_000186.jpg 1
positivite/IMG_000188.jpg 1
positivite/IMG_000189.jpg 1
positivite/IMG_000194.jpg 1
positivite/IMG_000196.jpg 1
positivite/IMG_000199.jpg 1
positivite/IMG_000201.jpg 1
positivite/IMG_000202.jpg 1
positivite/IMG_000203.jpg 1
negative_eg/IMG_000180_3.jpg 0
negative_eg/IMG_000184_0.jpg 0
negative_eg/IMG_000184_1.jpg 0
negative_eg/IMG_000184_2.jpg 0
negative_eg/IMG_000184_3.jpg 0
negative_eg/IMG_000186_0.jpg 0
> negative_eg/IMG_000186_1.jpg 0
........................

3.修改一下create_imagenet.sh

主要就是改寫漢語註釋部分

#!/usr/bin/env sh
# Create the imagenet lmdb inputs
# N.B. set the path to the imagenet train + val data dirs
set -e
#案例路徑
EXAMPLE=/home/ubuntu/hudie_detection_case 
#資料根目錄
DATA=/home/ubuntu/hudie_detection_case
#caffebuild/tools的絕對路徑
TOOLS=/home/ubuntu/caffe/caffe/build/tools
#測試資料和訓練資料根目錄
TRAIN_DATA_ROOT=/home/ubuntu/hudie_detection_case/train/
VAL_DATA_ROOT=/home/ubuntu/hudie_detection_case/train/

# Set RESIZE=true to resize the images to 256x256. Leave as false if images have
# already been resized using another tool.
#根據需求是否需要把圖片縮放成統一大小
RESIZE=true
if $RESIZE; then
  RESIZE_HEIGHT=227
  RESIZE_WIDTH=227
else
  RESIZE_HEIGHT=0
  RESIZE_WIDTH=0
fi

if [ ! -d "$TRAIN_DATA_ROOT" ]; then
  echo "Error: TRAIN_DATA_ROOT is not a path to a directory: $TRAIN_DATA_ROOT"
  echo "Set the TRAIN_DATA_ROOT variable in create_imagenet.sh to the path" \
       "where the ImageNet training data is stored."
  exit 1
fi

if [ ! -d "$VAL_DATA_ROOT" ]; then
  echo "Error: VAL_DATA_ROOT is not a path to a directory: $VAL_DATA_ROOT"
  echo "Set the VAL_DATA_ROOT variable in create_imagenet.sh to the path" \
       "where the ImageNet validation data is stored."
  exit 1
fi

echo "Creating train lmdb..."

GLOG_logtostderr=1 $TOOLS/convert_imageset \
    --resize_height=$RESIZE_HEIGHT \
    --resize_width=$RESIZE_WIDTH \
    --shuffle \
    $TRAIN_DATA_ROOT \
    $DATA/train.txt \
    $EXAMPLE/ilsvrc12_train_lmdb

echo "Creating val lmdb..."

GLOG_logtostderr=1 $TOOLS/convert_imageset \
    --resize_height=$RESIZE_HEIGHT \
    --resize_width=$RESIZE_WIDTH \
    --shuffle \
    $VAL_DATA_ROOT \
    $DATA/val.txt \
    $EXAMPLE/ilsvrc12_val_lmdb

echo "Done."

這些準備完畢之後，執行sudo sh ./create_imagenet.sh，如果沒有報錯，恭喜！報錯了，可能是caffe依賴包沒有安裝好或者重新執行上述步驟。

4.製作神經網路模型train_val.prototxt

這裡使用的是AlexNet模型，此處主要修改輸入檔案路徑，輸出路徑，以及softmax層的輸出類數，已用黑體標出（分類個數）

name: "AlexNet"
layer {
  name: "data"
  type: "Data"
  top: "data"
  top: "label"
  include {
    phase: TRAIN
  }
  transform_param {
    mirror: true
    crop_size: 227
    #mean_file: "data/ilsvrc12/imagenet_mean.binaryproto"
  }
  data_param {
    **source: "/home/ubuntu/hudie_detection_case/ilsvrc12_train_lmdb"**
    batch_size: 2
    backend: LMDB
  }
}
layer {
  name: "data"
  type: "Data"
  top: "data"
  top: "label"
  include {
    phase: TEST
  }
  transform_param {
    mirror: false
    crop_size: 227
    #mean_file: "data/ilsvrc12/imagenet_mean.binaryproto"
  }
  data_param {
    **source: "/home/ubuntu/hudie_detection_case/ilsvrc12_val_lmdb"**
    batch_size: 2
    backend: LMDB
  }
}
layer {
  name: "conv1"
  type: "Convolution"
  bottom: "data"
  top: "conv1"
  param {
    lr_mult: 1
    decay_mult: 1
  }
  param {
    lr_mult: 2
    decay_mult: 0
  }
  convolution_param {
    num_output: 96
    kernel_size: 11
    stride: 4
    weight_filler {
      type: "gaussian"
      std: 0.01
    }
    bias_filler {
      type: "constant"
      value: 0
    }
  }
}
layer {
  name: "relu1"
  type: "ReLU"
  bottom: "conv1"
  top: "conv1"
}
layer {
  name: "norm1"
  type: "LRN"
  bottom: "conv1"
  top: "norm1"
  lrn_param {
    local_size: 5
    alpha: 0.0001
    beta: 0.75
  }
}
layer {
  name: "pool1"
  type: "Pooling"
  bottom: "norm1"
  top: "pool1"
  pooling_param {
    pool: MAX
    kernel_size: 3
    stride: 2
  }
}
layer {
  name: "conv2"
  type: "Convolution"
  bottom: "pool1"
  top: "conv2"
  param {
    lr_mult: 1
    decay_mult: 1
  }
  param {
    lr_mult: 2
    decay_mult: 0
  }
  convolution_param {
    num_output: 256
    pad: 2
    kernel_size: 5
    group: 2
    weight_filler {
      type: "gaussian"
      std: 0.01
    }
    bias_filler {
      type: "constant"
      value: 0.1
    }
  }
}
layer {
  name: "relu2"
  type: "ReLU"
  bottom: "conv2"
  top: "conv2"
}
layer {
  name: "norm2"
  type: "LRN"
  bottom: "conv2"
  top: "norm2"
  lrn_param {
    local_size: 5
    alpha: 0.0001
    beta: 0.75
  }
}
layer {
  name: "pool2"
  type: "Pooling"
  bottom: "norm2"
  top: "pool2"
  pooling_param {
    pool: MAX
    kernel_size: 3
    stride: 2
  }
}
layer {
  name: "conv3"
  type: "Convolution"
  bottom: "pool2"
  top: "conv3"
  param {
    lr_mult: 1
    decay_mult: 1
  }
  param {
    lr_mult: 2
    decay_mult: 0
  }
  convolution_param {
    num_output: 384
    pad: 1
    kernel_size: 3
    weight_filler {
      type: "gaussian"
      std: 0.01
    }
    bias_filler {
      type: "constant"
      value: 0
    }
  }
}
layer {
  name: "relu3"
  type: "ReLU"
  bottom: "conv3"
  top: "conv3"
}
layer {
  name: "conv4"
  type: "Convolution"
  bottom: "conv3"
  top: "conv4"
  param {
    lr_mult: 1
    decay_mult: 1
  }
  param {
    lr_mult: 2
    decay_mult: 0
  }
  convolution_param {
    num_output: 384
    pad: 1
    kernel_size: 3
    group: 2
    weight_filler {
      type: "gaussian"
      std: 0.01
    }
    bias_filler {
      type: "constant"
      value: 0.1
    }
  }
}
layer {
  name: "relu4"
  type: "ReLU"
  bottom: "conv4"
  top: "conv4"
}
layer {
  name: "conv5"
  type: "Convolution"
  bottom: "conv4"
  top: "conv5"
  param {
    lr_mult: 1
    decay_mult: 1
  }
  param {
    lr_mult: 2
    decay_mult: 0
  }
  convolution_param {
    num_output: 256
    pad: 1
    kernel_size: 3
    group: 2
    weight_filler {
      type: "gaussian"
      std: 0.01
    }
    bias_filler {
      type: "constant"
      value: 0.1
    }
  }
}
layer {
  name: "relu5"
  type: "ReLU"
  bottom: "conv5"
  top: "conv5"
}
layer {
  name: "pool5"
  type: "Pooling"
  bottom: "conv5"
  top: "pool5"
  pooling_param {
    pool: MAX
    kernel_size: 3
    stride: 2
  }
}
layer {
  name: "fc6"
  type: "InnerProduct"
  bottom: "pool5"
  top: "fc6"
  param {
    lr_mult: 1
    decay_mult: 1
  }
  param {
    lr_mult: 2
    decay_mult: 0
  }
  inner_product_param {
    num_output: 4096
    weight_filler {
      type: "gaussian"
      std: 0.005
    }
    bias_filler {
      type: "constant"
      value: 0.1
    }
  }
}
layer {
  name: "relu6"
  type: "ReLU"
  bottom: "fc6"
  top: "fc6"
}
layer {
  name: "drop6"
  type: "Dropout"
  bottom: "fc6"
  top: "fc6"
  dropout_param {
    dropout_ratio: 0.5
  }
}
layer {
  name: "fc7"
  type: "InnerProduct"
  bottom: "fc6"
  top: "fc7"
  param {
    lr_mult: 1
    decay_mult: 1
  }
  param {
    lr_mult: 2
    decay_mult: 0
  }
  inner_product_param {
    num_output: 4096
    weight_filler {
      type: "gaussian"
      std: 0.005
    }
    bias_filler {
      type: "constant"
      value: 0.1
    }
  }
}
layer {
  name: "relu7"
  type: "ReLU"
  bottom: "fc7"
  top: "fc7"
}
layer {
  name: "drop7"
  type: "Dropout"
  bottom: "fc7"
  top: "fc7"
  dropout_param {
    dropout_ratio: 0.5
  }
}
layer {
  name: "fc8"
  type: "InnerProduct"
  bottom: "fc7"
  top: "fc8"
  param {
    lr_mult: 1
    decay_mult: 1
  }
  param {
    lr_mult: 2
    decay_mult: 0
  }
  inner_product_param {
    **num_output: 2**
    weight_filler {
      type: "gaussian"
      std: 0.01
    }
    bias_filler {
      type: "constant"
      value: 0
    }
  }
}
layer {
  name: "accuracy"
  type: "Accuracy"
  bottom: "fc8"
  bottom: "label"
  top: "accuracy"
  include {
    phase: TEST
  }
}
layer {
  name: "loss"
  type: "SoftmaxWithLoss"
  bottom: "fc8"
  bottom: "label"
  top: "loss"
}

5.之後修改slover.prototxt

主要引數已黑體

**net: "/home/ubuntu/hudie_detection_case/train_val.prototxt"**
test_iter: 1000
test_interval: 1000
#基礎學習率
**base_lr: 0.001**
lr_policy: "step"
gamma: 0.1
stepsize: 100000
#每訓練20次顯示資訊
**display: 20**
max_iter: 450000
momentum: 0.9
weight_decay: 0.0005
#每訓練10000次儲存模型，路徑為models
**snapshot: 10000**
snapshot_prefix: "models"
solver_mode: CPU

完成這些，後緊接著就是緊張而又緩慢的訓練工作了，可能十幾分鍾，可能十幾天。看你的資料量大小和模型法咋都了

6. 執行train_caffenet.sh

其內容如下

#!/usr/bin/env sh
set -e
#caffe 路徑
/home/ubuntu/caffe/caffe/build/tools/caffe train \
    --solver=/home/ubuntu/hudie_detection_case/solver.prototxt [email protected]

訓練介面（部分截圖）如下，接下來就等吧：
這裡寫圖片描述

caffe模型訓練全過程（一）指令碼、資料準備與製作

1.首先建立工程資料夾資料夾結構如下 |——project ├── create_imagenet.sh #生成lmdb檔案的指令碼 |——train_lmdb ├── data.mdb └── lock.mdb

caffe目標檢測模型訓練全過程（三）目標檢測第一步

遍歷整圖查詢蝴蝶位置 2018/04/22 訓練模型對於識別背景和蝴蝶有比較好的效果，基本對不會識別錯誤，接下來，將通過整圖遍歷的原始而又野蠻的方式對一張原始圖片進行處理，進而查詢到蝴蝶的具體位置。具體思路如下圖。對原圖進行縮放成理想大小，例如，最小邊長縮放為227*6畫素，最大邊長等比

caffe目標檢測模型訓練全過程（二）python載入caffemodel分類

繼上篇 caffe目標檢測模型訓練全過程（一）指令碼、資料準備與製作之後，我們訓練出來了其模型，如圖所示： models2_iter_70000.caffemodel 就是需要呼叫的模型，70

JavaScript複習筆記（一）變數、資料型別和運算子

1、JavaScript用來做什麼 HTML：專門編寫網頁內容的語言 CSS：專門美化網頁內容樣式的語言 JavaScript：專門編寫互動程式的語言 JavaScript包含三個方面：ECMAScript標準+DOM標準+BOM 2、常用語句在控制檯中輸出一段話 &nbs

深度探索C++對象模型讀書筆記（一）

復雜理解 image play 基礎上 isp 靜態布局 bject 《深度探索C++對象模型》這本書也算是學習C++面向對象編程的必備書了，打算花上幾天先簡單的看一遍，這種書看上好幾遍也不一定能理解太多，慢慢積累一點一滴吃透就好。下面把我看書過程中覺得比較有意義的摘錄

Tesseract-OCR 訓練教程（一）

MF 根據 echo 實際應用 temp sse 自己文件替換實際應用中[font]替換為你自己的字體名，比如newfont、hehe等 1.根據tif生成box文件（位置寬高等信息）tesseract [font].font.exp0.tif [font].font

Jmeter（一）指令碼錄製工具badboy和Jmeter基本使用

一、badboy簡介 badboy是一款用C++開發的動態應用測試工具，擁有強大的螢幕錄製和回放功能，並且可將錄製的指令碼匯出為jmx格式，並直接匯入到jmeter中使用，可以大大的方便我們的使用，可以從其官方網站進行下載：badboy官網。二、badboy指令碼錄製下載

Vmware虛擬機器完整建立一個linux（Ubuntu）系統全過程（一）

所需軟體下載： Vmware10虛擬機器+ubuntu16.04.3+啟用金鑰獲取提取密碼: 8bzm 當軟體下載完畢後我們就做好了一個完整虛擬機器所需要的所有初步軟體，所以接下來我們先進行第一步Vmware虛擬機器的安裝。第

聊聊高併發（三十三）Java記憶體模型那些事（一）從一致性(Consistency)的角度理解Java記憶體模型

可以說併發系統要解決的最核心問題之一就是一致性的問題，關於一致性的研究已經有幾十年了，有大量的理論，演算法支援。這篇說說一致性這個主題一些經常提到的概念，理清Java記憶體模型在其中的位置。一致性問題更準確的說是一致性需求，看系統需要什麼樣的一致性保證。比如分散式領域

深度學習分散式訓練實戰（一）

本系列部落格主要介紹使用Pytorch和TF進行分散式訓練，本篇重點介紹相關理論，分析為什麼要進行分散式訓練。後續會從程式碼層面逐一介紹實際程式設計過程中如何實現分散式訓練。常見的訓練方式單機單卡（單GPU）這種訓練方式一般就是在自己筆記本上，窮學生專

openpose訓練程式碼（一）

openspoe本身是很繁雜的，包含了人體姿態估計、手勢估計、臉部關鍵點提取，還有3Dpose，是在caffe上再做的一層封裝，但是如果我們實際要去用的話，很多其實都是不需要的，比如openpose裡面的多執行緒，GUI等等，我們只需要關注一些核心的東西

深度學習——被Intel caffe支配的恐懼（一）

一、Intel caffe在Ubuntu上的安裝配置 1. 安裝配置MKL-DNN 我用的是CPU版本的caffe，安裝配置MKL-DNN可以提高caffe訓練的速度。英特爾MKL-DNN專為在英特爾架構上加快深度學習框架的速度而設計，包含高度向量化和執

顯著性目標檢測模型評價指標（一）——平均絕對誤差：Mean Absolute Error(MAE)

顯著性目標檢測模型評價指標之平均絕對誤差(MAE)原理與實現程式碼目錄一、顯著性目標檢測簡介顯著性目標(Salient Object)：當我們在看一張圖片時，注意力首先會落在我們所感興趣的物體部分。比如我們看到一張畫有羊

4.4.2分類模型評判指標（一）

簡介混淆矩陣是ROC曲線繪製的基礎，同時它也是衡量分型別模型準確度中最基本，最直觀，計算最簡單的方法。一句話解釋版本：混淆矩陣就是分別統計分類模型歸錯類，歸對類的觀測值個數，然後把結果放在一個表裡展示出來。這個表就是混淆矩陣。資料分析與挖掘體系位置混淆矩陣是評判模型結果的指標

隱馬爾可夫模型學習筆記（一）：前後向演算法介紹與推導

學習隱馬爾可夫模型（HMM），主要就是學習三個問題：概率計算問題，學習問題和預測問題。概率計算問題主要是講前向演算法和後向演算法，這兩個演算法可以說是隱馬爾可夫的重中之重，接下來會依次介紹以下內容。隱馬爾可夫模型介紹模型的假設直接計演算法，前向演算法，後向演

Linux 裝置模型基本概念（一）

1、裝置模型引入 Linux 2.6核心最初為了應付電源管理的需要，提出了一個裝置模型來管理所有的裝置。在物理上，外設之間是有一種層次關係的，比如把一個U盤插到筆記本上，實際上這個U盤是接在一個USB Hub上，USB Hub又是接在USB 2.0 Host Contro

caffe Segnet 語義分割（一）

2018.02.26 learning journal by 趙木木 1. 編譯slam3d出錯記錄 Qt 編譯器可以清楚的查到錯誤所在位置；在Issues中檢視【error1】: could not convert

android之wifi移植全過程（一）

硬體環境 WIFI模組：Marvell8686 SDIO WIFI 開發板：S5PC100

PHP開發APP介面全過程（一）

1、學習要點：伺服器端 –> 資料庫|快取 –>呼叫介面 –>客戶端 2、APP介面介紹：（PHP開發APP介面） PHP面向物件的介面：抽象類，interface定義 ==>interface.php

linux裝置驅動模型架構分析（一）——概述

概述 LDD3中說：“Linux核心需要一個對系統結構的一般性描述。”這個描述就是linux裝置驅動模型（下面簡稱為LDDM）。LDDM不是獨立存在，其體系如下圖所示： LDDM體系結構對架構的每一部分本文都會開闢獨立的章節進行描述。暫且拋開這個架構，首先從總體上了

caffe模型訓練全過程（一）指令碼、資料準備與製作

1.首先建立工程資料夾

資料夾結構如下

2.製作LMDB資料來源

首先生成train.txt and val.txt兩個包含路徑的文字檔案

其如下：

3.修改一下create_imagenet.sh

4.製作神經網路模型train_val.prototxt

5.之後修改slover.prototxt

6. 執行train_caffenet.sh

相關推薦