利用caffe訓練網路的步驟

阿新 • • 發佈：2019-01-21

0：將圖片設定好標號（從0開始的連續自然數）

1：首先需要將圖片轉換成需要的資料格式

#!/usr/bin/env sh
# Create the imagenet lmdb inputs
# N.B. set the path to the imagenet train + val data dirs

# EXAMPLE=examples/imagenet
# DATA=data/ilsvrc12
TOOLS=build/tools

# TRAIN_DATA_ROOT=/path/to/imagenet/train/
# VAL_DATA_ROOT=/path/to/imagenet/val/
TRAIN_DATA_ROOT=/examples/jb/train/
VAL_DATA_ROOT=/examples/jb//val/
LABEL_ROOT=/examples/jb
SAVE_DATA_ROOT=/examples/jb/data

# Set RESIZE=true to resize the images to 256x256. Leave as false if images have
# already been resized using another tool.
# RESIZE=false
RESIZE=true
if $RESIZE; then
  RESIZE_HEIGHT=32
  RESIZE_WIDTH=32
else
  RESIZE_HEIGHT=0
  RESIZE_WIDTH=0
fi

if [ ! -d "$TRAIN_DATA_ROOT" ]; then
  echo "Error: TRAIN_DATA_ROOT is not a path to a directory: $TRAIN_DATA_ROOT"
  echo "Set the TRAIN_DATA_ROOT variable in create_imagenet.sh to the path" \
       "where the ImageNet training data is stored."
  exit 1
fi

if [ ! -d "$VAL_DATA_ROOT" ]; then
  echo "Error: VAL_DATA_ROOT is not a path to a directory: $VAL_DATA_ROOT"
  echo "Set the VAL_DATA_ROOT variable in create_imagenet.sh to the path" \
       "where the ImageNet validation data is stored."
  exit 1
fi

echo "Creating train lmdb..."

GLOG_logtostderr=1 $TOOLS/convert_imageset \
    --resize_height=$RESIZE_HEIGHT \
    --resize_width=$RESIZE_WIDTH \
    --shuffle \
    $TRAIN_DATA_ROOT \
    $LABEL_ROOT/train.txt \
    $SAVE_DATA_ROOT/train_lmdb

echo "Creating val lmdb..."

GLOG_logtostderr=1 $TOOLS/convert_imageset \
    --resize_height=$RESIZE_HEIGHT \
    --resize_width=$RESIZE_WIDTH \
    --shuffle \
    $VAL_DATA_ROOT \
    $LABEL_ROOT/val.txt \
    $SAVE_DATA_ROOT/val_lmdb

echo "Done."

2：計算訓練樣本的均值（彩色圖時需要）

#!/usr/bin/env sh
# Compute the mean image from the imagenet training leveldb
# N.B. this is available in data/ilsvrc12

./build/tools/compute_image_mean examples/jb/data/train_lmdb \
  examples/jb/data/image_mean.binaryproto

echo "Done."

3：定義好網路的結構

name: "AlexNet"
layers {
  name: "data"
  type: DATA
  top: "data"
  top: "label"
  data_param {
    source: "examples/jb/data/train_lmdb"
    backend: LMDB
    batch_size: 256
  }
  transform_param {
    crop_size: 227
    mean_file: "examples/jb/data/image_mean.binaryproto"
    mirror: true
  }
  include: { phase: TRAIN }
}
layers {
  name: "data"
  type: DATA
  top: "data"
  top: "label"
  data_param {
    source: "examples/jb/data/val_lmdb"
    backend: LMDB
    batch_size: 50
  }
  transform_param {
    crop_size: 227
    mean_file: "examples/jb/data/image_mean.binaryproto"
    mirror: false
  }
  include: { phase: TEST }
}
layers {
  name: "conv1"
  type: CONVOLUTION
  bottom: "data"
  top: "conv1"
  blobs_lr: 1
  blobs_lr: 2
  weight_decay: 1
  weight_decay: 0
  convolution_param {
    num_output: 64
    kernel_size: 5
    stride: 1
    weight_filler {
      type: "gaussian"
      std: 0.01
    }
    bias_filler {
      type: "constant"
      value: 0
    }
  }
}
layers {
  name: "relu1"
  type: RELU
  bottom: "conv1"
  top: "conv1"
}
layers {
  name: "norm1"
  type: LRN
  bottom: "conv1"
  top: "norm1"
  lrn_param {
    local_size: 9
    alpha: 0.0001
    beta: 0.75
  }
}
layers {
  name: "pool1"
  type: POOLING
  bottom: "norm1"
  top: "pool1"
  pooling_param {
    pool: MAX
    kernel_size: 3
    stride: 2
  }
}
layers {
  name: "conv2"
  type: CONVOLUTION
  bottom: "pool1"
  top: "conv2"
  blobs_lr: 1
  blobs_lr: 2
  weight_decay: 1
  weight_decay: 0
  convolution_param {
    num_output: 64
    pad: 2
    kernel_size: 5
    group: 2
    weight_filler {
      type: "gaussian"
      std: 0.01
    }
    bias_filler {
      type: "constant"
      value: 0.1
    }
  }
}
layers {
  name: "relu2"
  type: RELU
  bottom: "conv2"
  top: "conv2"
}
layers {
  name: "norm2"
  type: LRN
  bottom: "conv2"
  top: "norm2"
  lrn_param {
    local_size: 9
    alpha: 0.0001
    beta: 0.75
  }
}
layers {
  name: "pool2"
  type: POOLING
  bottom: "norm2"
  top: "pool2"
  pooling_param {
    pool: MAX
    kernel_size: 3
    stride: 2
  }
}
layers {
  name: "conv3"
  type: CONVOLUTION
  bottom: "pool2"
  top: "conv3"
  blobs_lr: 1
  blobs_lr: 2
  weight_decay: 1
  weight_decay: 0
  convolution_param {
    num_output: 64
    pad: 1
    kernel_size: 3
    weight_filler {
      type: "gaussian"
      std: 0.01
    }
    bias_filler {
      type: "constant"
      value: 0
    }
  }
}
layers {
  name: "relu3"
  type: RELU
  bottom: "conv3"
  top: "conv3"
}
layers {
  name: "conv4"
  type: CONVOLUTION
  bottom: "conv3"
  top: "conv4"
  blobs_lr: 1
  blobs_lr: 2
  weight_decay: 1
  weight_decay: 0
  convolution_param {
    num_output: 32
    pad: 1
    kernel_size: 3
    group: 2
    weight_filler {
      type: "gaussian"
      std: 0.01
    }
    bias_filler {
      type: "constant"
      value: 0.1
    }
  }
}
layers {
  name: "relu4"
  type: RELU
  bottom: "conv4"
  top: "conv4"
}
layers {
  name: "fc6"
  type: INNER_PRODUCT
  bottom: "conv4"
  top: "fc6"
  blobs_lr: 1
  blobs_lr: 2
  weight_decay: 1
  weight_decay: 0
  inner_product_param {
    num_output: 43
    weight_filler {
      type: "gaussian"
      std: 0.005
    }
    bias_filler {
      type: "constant"
      value: 0.1
    }
  }
}
layers {
  name: "relu6"
  type: RELU
  bottom: "fc6"
  top: "fc6"
}
layers {
  name: "accuracy"
  type: ACCURACY
  bottom: "fc6"
  bottom: "label"
  top: "accuracy"
  include: { phase: TEST }
}
layers {
  name: "loss"
  type: SOFTMAX_LOSS
  bottom: "fc6"
  bottom: "label"
  top: "loss"
}

4：定義好sover檔案

net: "examples/jb/train_val.prototxt"
test_iter: 1000
test_interval: 1000
base_lr: 0.01
lr_policy: "step"
gamma: 0.1
stepsize: 100000
display: 20
max_iter: 450000
momentum: 0.9
weight_decay: 0.0005
snapshot: 10000
snapshot_prefix: "examples/jb/models/caffe_alexnet_train"
solver_mode: GPU

5：訓練網路

#!/usr/bin/env sh

echo "begin to train the net!"
./build/tools/caffe train \
    --solver=examples/jb/solver.prototxt
echo "the net is finish"

這樣就完成了網路的整個訓練過程，之後可以利用這個模型進行測試。

利用caffe訓練網路的步驟

0：將圖片設定好標號（從0開始的連續自然數） 1：首先需要將圖片轉換成需要的資料格式 #!/usr/bin/env sh # Create the imagenet lmdb inputs # N.B. set the path to the imagenet train

如何利用caffe訓練自己資料集

這篇博文主要參考了另一位博主https://blog.csdn.net/hellohaibo，在此向他表示感謝首先，博主今天的caffe崩了，毫無徵兆的崩了，具體表現為博主想做一個更大的資料集，但是在生成lmbd檔案時永遠生成的是一個沒有名字的資料夾，可是博主已經在指定的example目錄裡寫了

caffe訓練網路時loss突然增大並維持在86.3333333的問題解決

caffe中loss表示網路的收斂情況。loss不斷變小表示網路是收斂的，正常情況下，loss會小到零點幾的一個數之後上下波動。造成loss突然增大並一直不降，可能的原因有很多種。大體如下：資料

利用caffe訓練好的模型測試自己的手寫字型圖片

轉載地址： http://blog.csdn.net/xunan003/article/details/73126425 一、前沿寫這篇博文，是因為一開始在做《21天學習caffe》第6天6.4練習題1的時候看著自己搜尋的博文，在不理解其根本的情況下做的

深度學習與人臉識別系列（3）__利用caffe訓練深度學習模型

name: "VGG_FACE_16_layers" layer { top: "data_1" top: "label_1" name: "data_1" type: "Data" data_param { source: "/media/gk/9ec75485-26b1-471

利用caffe訓練cifar之訓練資料集合生成leveldb

1.首先要搭建好VS+Caffe的訓練環境。 2.下載訓練集合Cifar: 獲得訓練集合：cifar-10-binary.tar.gz 解壓縮後獲得cifar-10-batches-bin資料檔

caffe訓練網路的實踐

Caffe現如今已經成為了深度學習一個非常火的框架。但是作為剛接觸CNN或者caffe的小白可能對caffe的介面或者細節不是很清楚瞭解。本文作為嘗試著利用caffe做一個簡單的圖片分類model，希望能夠與大家快速入門caffe訓練屬於自己的資料。首先，要準備自

深度學習與人臉識別系列（4）__利用caffe訓練深度學習模型

name: "VGG_FACE_16_layers" layer { top: "data_1" top: "label_1" name: "data_1" type: "Data" data_param { source: "/media/gk/9ec75485-26b1-471

用caffe訓練LeNet網路的步驟

以mnist手寫體資料為例1.準備資料cd $CAFFE_ROOT./data/mnist/get_mnist.sh./examples/mnist/create_mnist.sh2.定義Net$CAFFE_ROOT/examples/mnist/lenet_train_te

Caffe框架原始碼剖析(2)—訓練網路

中間因為工程開發等雜七雜八原因暫停了Caffe原始碼分析，現在繼續補上。上篇分析在函式 train() 中建立了網路，接下來就是進入訓練網路步驟了。在函式train()中，使用前一步建立好的solver智慧指標物件呼叫函式Solve()， int train() {

Caffe訓練深度學習網路的暫停與繼續

Caffe訓練深度學習網路的暫停與繼續博主在訓練Caffe模型的過程中，遇到了如何暫停訓練並斷點繼續訓練的問題。在此記錄下有關這個問題的幾種解決方案。更新於2018.10.27。方法1：臨時暫停這種方法是用於臨時暫停Caffe訓練，暫停後可以以完全相同的配置從斷點處繼續

深度學習Caffe實戰（9）Windows 平臺caffe用MATLAB介面實現訓練網路和測試

上一篇介紹了網路協議中各個引數的作用，知道了各個引數的作用，想必應該可以嘗試修改網路結構了。前幾篇部落格介紹的都是用命令列訓練和測試網路，這篇部落格介紹如何用MATLAB介面實現訓練和測試網路，window平臺下caffe使用者本來就少，這方面的資料更少了，下一

faster-rcnn之caffe下利用vgg16訓練及預測

工作中經常用到py-faster-rcnn做圖片的檢測與識別，訓練過程有必要記錄一下，下面是參照網上的一些資料整理實踐後的總結： py-faster-rcnn的github地址：https://github.com/rbgirshick/py-faster-r

利用caffe日誌進行測試精度訓練損失等的畫圖（caffe訓練結果視覺化）

本文主要介紹，將caffe訓練得到的accracy,loss進行影象化。對於一般caffe訓練結果的視覺化： 1.在訓練時，需要將訓練的結果儲存日誌。 train.sh： #!/usr/bin/env sh TOOLS=/home/zhuangni/code/Mu

利用tensorflow訓練自己的圖片資料（5）——測試訓練網路

一.說明上一篇部落格中，我們已經將建立好的網路模型訓練好了，並將訓練的網路引數儲存在相應的檔案中；下面我們就開始測試網路，驗證網路的訓練效果；本次測試為隨機的單圖片測試，即隨機的從訓練集或測試集中讀取一張圖片，送入到神經網路中進行識別，列印識別率及識別的影象。二. 程式

利用tensorflow訓練自己的圖片資料（3）——建立網路模型

一. 說明在上一部落格——利用tensorflow訓練自己的圖片資料（2）中，我們已經獲得了神經網路的訓練輸入資料：image_batch，label_batch。接下就是建立神經網路模型，筆者的網路模型結構如下：輸入資料：（batch_size，IMG_W，IMG_H

利用TensorFlow訓練簡單的二分類神經網路模型

利用TensorFlow實現《神經網路與機器學習》一書中4.7模式分類練習具體問題是將如下圖所示雙月牙資料集分類。使用到的工具: python3.5 tensorflow1.2.1 n

[機器學習]利用TensorFlow訓練一個簡單的神經網路

利用TensorFlow訓練一個簡單的神經網路我們在這裡利用TensorFlow的Eager Execution 來構建模型，這樣不用像以前一樣建立Graph和Session了，可以使神經網路的訓練更加方便快捷，下面以Iris資料集為例來訓練一個神經網路，程

caffe網路配置train_val.prototxt轉換成digits裡的網路步驟

1.去掉Data層中的transform_param中的mean_file和backend，會自動讀取之前資料集裡生成的，mirror和crop_size不受影響，需要就填，不需要就不填 2.改 include { phase: TRAIN } 為 inclu

單通道灰度圖片fine-tune訓練網路與caffe批量分類測試

1. 轉imdb灰度圖資料一定要加上--gray，否則訓練時報如下錯誤： GLOG_logtostderr=1 $TOOLS/convert_imageset \ --resize_height=$RESIZE_HEIGHT \ --resize_w

利用caffe訓練網路的步驟

相關推薦