Caffe入門例項與詳解人工智慧框架

阿新 • • 發佈：2018-11-15

Caffe的幾個重要檔案

用了這麼久Caffe都沒好好寫過一篇新手入門的部落格，最近應實驗室小師妹要求，打算寫一篇簡單、快熟入門的科普文。
利用Caffe進行深度神經網路訓練第一步需要搞懂幾個重要檔案：

solver.prototxt
train_val.prototxt
train.sh

接下來我們按順序一個個說明。

solver.prototxt
solver這個檔案主要存放模型訓練所用到的一些超引數：

net := 指定待訓練模型結構檔案，即train_val.prototxt
test_interval := 測試間隔，即每隔多少次迭代進行一次測試

test_initialization := 指定是否進行初始測試，即模型未進行訓練時的測試
test_iteration := 指定測試時進行的迭代次數
base_lr := 指定基本學習率
lr_policy := 學習率變更策略，這裡有介紹，可供參考
gamma := 學習率變更策略需要用到的引數
power := 同上
stepsize := 學習率變更策略Step的變更步長（固定步長）
stepvalue := 學習率變更策略Multistep的變更步長（可變步長）
max_iter := 模型訓練的最大迭代次數
momentum := 動量，這是優化策略（Adam, SGD, … ）用到的引數
momentum2 := 優化策略Adam用到的引數
weight_decay := 權重衰減率
clip_gradients := 固定梯度範圍
display := 每隔幾次迭代顯示一次結果
snapshot := 快照，每隔幾次儲存一次模型引數

snapshot_prefix := 儲存模型檔案的字首，可以是路徑
type := solver優化策略，即SGD、Adam、AdaGRAD、RMSProp、NESTROVE、ADADELTA等
solver_mode := 指定訓練模式，即GPU/CPU
debug_info := 指定是否列印除錯資訊，這裡有對啟用該功能的輸出作介紹
device_id := 指定裝置號（使用GPU模式），預設為0
使用者根據自己的情況進行相應設定，黑體引數為必須指定的，其餘引數為可選（根據情況選擇）。

train_val.prototxt

train_val檔案是用來存放模型結構的地方

模型的結構主要以layer為單位來構建。下面我們以LeNet為例介紹網路層的基本組成：

name: "LeNet"
layer {
  name: "mnist"                                #網路層名稱
  type: "Data"                                 #網路層型別，資料層
  top: "data"                                  #這一層的輸出，資料
  top: "label"                                 #這一層的輸出，標籤
  include {    phase: TRAIN  }                 #TRAIN:=用於訓練,TEST:=用於測試
  transform_param {    scale: 0.00390625  }    #對資料進行scale
  data_param {                                 #資料層配置 
    source: "examples/mnist/mnist_train_lmdb"  #資料存放路徑
    batch_size: 64                             #指定batch大小
    backend: LMDB                              #指定資料庫格式，LMDB/LevelDB
  }
}
layer {
  name: "mnist"
  type: "Data"
  top: "data"
  top: "label"
  include {    phase: TEST  }
  transform_param {    scale: 0.00390625  }
  data_param {
    source: "examples/mnist/mnist_test_lmdb"
    batch_size: 100
    backend: LMDB
  }
}
layer{
    name:"conv1"       
    type:"Convolution" #卷積層
    bottom:"data"      #上一層的輸出作為輸入
    top:"conv1"        
    param{name:"conv1_w" lr_mult:1 decay_mult:1} #卷積層引數w的名稱，學習率和衰減率（相對於base_lr和weight_decay的倍數）
    param{name:"conv1_b" lr_mult:2 decay_mult:0} #卷積層引數b的名稱，學習率和衰減率
    convolution_param{
        num_output:20         #卷積層輸出的feature map數量 
        kernel_size:5         #卷積層的大小
        pad:0                 #卷積層的填充大小
        stride:1              #進行卷積的步長
        weight_filler{type:"xavier" }      #引數w的初始話策略
        weight_filler{type:"constant" value:0.1}     #引數b的初始化策略
    }
}
layer {　　　　　　　　＃BatchNorm層，對feature map進行批規範化處理
    name:"bn1"
    type:"BatchNorm"
    bottom:"conv1"
    top:"conv1"
    batch_norm_param{ use_global_stats:false} #訓練時為false，測試時為true
}
layer {           #池化層，即下采樣層
  name: "pool1"
  type: "Pooling"
  bottom: "conv1"
  top: "pool1"
  pooling_param {
    pool: MAX   #最大值池化，還有AVE均值池化
    kernel_size: 2
    stride: 2
  }
}
layer {
  name: "conv2"
  type: "Convolution"
  bottom: "pool1"
  top: "conv2"
  param {    lr_mult: 1  }
  param {    lr_mult: 2  }
  convolution_param {
    num_output: 50
    kernel_size: 5
    stride: 1
    weight_filler {      type: "xavier"    }
    bias_filler {      type: "constant"    }
  }
}
layer {
    name:"bn2"
    type:"BatchNorm"
    bottom:"conv2"
    top:"conv2"
    batch_norm_param{ use_global_stats:false}
}
layer {
  name: "pool2"
  type: "Pooling"
  bottom: "conv2"
  top: "pool2"
  pooling_param {
    pool: MAX
    kernel_size: 2
    stride: 2
  }
}
layer {           　　　           ＃全連線層
  name: "ip1"
  type: "InnerProduct"
  bottom: "pool2"
  top: "ip1"
  param {    lr_mult: 1  }  
  param {    lr_mult: 2  }
  inner_product_param {
    num_output: 500
    weight_filler {      type: "xavier"    }
    bias_filler {      type: "constant"    }
  }
}
layer {                             #啟用函式層，提供非線效能力
  name: "relu1"
  type: "ReLU"
  bottom: "ip1"
  top: "ip1"
}
layer {
  name: "ip2"
  type: "InnerProduct"
  bottom: "ip1"
  top: "ip2"
  param {    lr_mult: 1  }
  param {    lr_mult: 2  }
  inner_product_param {
    num_output: 10
    weight_filler {      type: "xavier"    }
    bias_filler {      type: "constant"    }
  }
}
layer {                             #損失函式層
  name: "prob"
  type: "SoftmaxWithLoss"
  bottom: "ip2"
  bottom: "label"
  top: "prob"
}

引數初始化策略可參考這裡，啟用函式可參考這裡。

網路結構和超引數都設計完了，接下來就可以進行模型訓練了。這裡我介紹最常用的模型訓練指令碼，也是Caffe官方文件給的例子。

train.sh

這個指令碼檔案可寫，可不寫。每次執行需要寫一樣的命令，所以建議寫一下。

TOOLS=/path/to/your/caffe/build/tools
GLOG_logtostderr=0 GLOG_log_dir=log/ \ #該行用於呼叫glog進行訓練日誌儲存，使用時請把該行註釋刪除，否則會出錯
$TOOLS/caffe train --solver=/path/to/your/solver.prototxt #--snapshot=/path/to/your/snapshot or --weights=/path/to/your/caffemodel ,snapshot和weights兩者只是選一，兩個引數都可以用來繼續訓練，區別在於是否儲存solver狀態

資料準備

這裡我們舉個簡單的例子，改程式碼是Caffe官方文件提供的，但只能用於單標籤的任務，多標籤得對原始碼進行修改。該指令碼是對圖片資料生成對應的lmdb檔案，博主一般使用原圖，即資料層型別用ImageData。

#!/usr/bin/env sh
# Create the imagenet lmdb inputs
# N.B. set the path to the imagenet train + val data dirs
set -e

EXAMPLE=""                            #儲存路徑
DATA=""                               #資料路徑
TOOLS=/path/to/your/caffe/build/tools #caffe所在目錄

TRAIN_DATA_ROOT=""                   #訓練資料根目錄
VAL_DATA_ROOT=""                     #測試資料根目錄
# RESIZE=true to resize the images to 256x256. Leave as false if images have
# already been resized using another tool.
RESIZE=false                         #重新調整圖片大小
if $RESIZE; then
  RESIZE_HEIGHT=256
  RESIZE_WIDTH=256
else
  RESIZE_HEIGHT=0
  RESIZE_WIDTH=0
fi

#檢測路徑是否存在
if [ ! -d "$TRAIN_DATA_ROOT" ]; then
  echo "Error: TRAIN_DATA_ROOT is not a path to a directory: $TRAIN_DATA_ROOT"
  echo "Set the TRAIN_DATA_ROOT variable in create_imagenet.sh to the path" \
       "where the ImageNet training data is stored."
  exit 1
fi

if [ ! -d "$VAL_DATA_ROOT" ]; then
  echo "Error: VAL_DATA_ROOT is not a path to a directory: $VAL_DATA_ROOT"
  echo "Set the VAL_DATA_ROOT variable in create_imagenet.sh to the path" \
       "where the ImageNet validation data is stored."
  exit 1
fi

echo "Creating train lmdb..."

GLOG_logtostderr=1 $TOOLS/convert_imageset \
    --resize_height=$RESIZE_HEIGHT \
    --resize_width=$RESIZE_WIDTH \
    --shuffle \
    $TRAIN_DATA_ROOT \
    $DATA/train.txt \                #訓練圖片列表，執行時請把該行註釋刪除，否則會出錯
    $EXAMPLE/mnist_train_lmdb

echo "Creating val lmdb..."

GLOG_logtostderr=1 $TOOLS/convert_imageset \
    --resize_height=$RESIZE_HEIGHT \
    --resize_width=$RESIZE_WIDTH \
    --shuffle \
    $VAL_DATA_ROOT \
    $DATA/val.txt \
    $EXAMPLE/mnist_test_lmdb

echo "Done."

Caffe入門例項與詳解人工智慧框架

Caffe的幾個重要檔案用了這麼久Caffe都沒好好寫過一篇新手入門的部落格，最近應實驗室小師妹要求，打算寫一篇簡單、快熟入門的科普文。利用Caffe進行深度神經網路訓練第一步需要搞懂幾個重要檔案： solver.prototxt train_val.proto

RabbitMQ學習總結（3）——入門例項教程詳解

一、起航本章節，柯南君將從幾個層面，用官網例子講解一下RabbitMQ的實操經典程式案例，讓大家重新回到經典“Hello world！”（The simplest thing that does something ）時代，RabbitMQ 支援N多種客戶

Hibernate - 檢索策略入門與詳解

檢索資料時的 2 個問題：不浪費記憶體：當 Hibernate 從資料庫中載入 Customer 物件時, 如果同時載入所有關聯的 Order 物件, 而程式實際上僅僅需要訪問 Customer 物件, 那麼這些關聯的 Order 物件就白白浪費了許多記憶體。更高的

SQL與NoSQL資料庫入門基礎知識詳解

SQL與NoSQL資料庫入門基礎知識詳解這幾年的大資料熱潮帶動了一激活了一大批hadoop學習愛好者。有自學hadoop的，有報名培訓班學習的。所有接觸過hadoop的人都知道，單獨搭建hadoop裡每個組建都需要執行環境、修改配置檔案測試等過程。對於我們這些入門級新手來說簡直每個都是坑。

高速電路設計實踐PDF,高速數字設計PDF-霍華德-約翰遜,高速電路設計與模擬分析Cadence例項設計詳解

今天給大家推薦三本關於高速電路設計的書籍，《高速電路設計實踐》《高速數字設計》《高速電路設計與模擬分析Cadence例項設計詳解》，第一本出自國內作者的一本好書，書中很多技術點都講的非常細緻，同時例舉了例項；第二本為國外作者霍華德-約翰遜，深入淺出的講解了高速電路設計中應該注意的各種

VTK與MFC聯合程式設計實現的單文件例項vtkSDI詳解

1. 例項的編譯執行新建工程時，可以直接通過cmake生成，但如果工程沒有編譯完全或者安裝成功的話，在安裝目錄沒法找到GUISupport/MFC/VTKMFCSettings.cmake,從而無法正常新建工程。這裡主要講解手動新建工程的過程，以方便大家的學習和進一步

Java NIO入門與詳解

nio 是 New I/O 的簡稱，屬於當時 jdk1.4 提供的新 api。如今 jdk 版本已經到 1.8 了，新 IO 這個稱謂有點不合適了，nio 還有一個更合適的叫法——非阻塞(non-blocking)IO。 1. nio與io對比 1

SSM框架註解的總結與詳解

Spring中的註解: 註解含義：用於建立物件的註解：相當於：<bean id="" class=""> @Component註解：

多圖詳解Spring框架的設計理念與設計模式

Spring作為現在最優秀的框架之一，已被廣泛的使用，51CTO也曾經針對Spring框架中的JDBC應用做過報道。本文將從另外一個視角試圖剖析出Spring框架的作者設計Spring框架的骨骼架構的設計理念，有那幾個核心元件？為什麼需要這些元件？它們又是如何結合在一

Dubbo入門-分散式原理詳解--搭建一個最簡單的Demo框架

Dubbo背景和簡介 Dubbo開始於電商系統，因此在這裡先從電商系統的演變講起。 1,單一應用框架(ORM) 當網站流量很小時，只需一個應用，將所有功能如下單支付等都部署在一起，以減少部署節點和成本。缺點：單一的系統架構，使得在開發過程中，佔用的資源越來越多，而且隨著流量的增加越來越難以維護 2.

Android入門——Broadcast Receiver詳解與應用

引言作為Android四大元件之一——BroadcastReceive。BroadcastReceive廣泛運用在APP的開發中，其他的三大應用元件不同一樣，是唯一需要被動接收，即負責接收的廣播接收器永遠不知道什麼時候可以接收到廣播，這種機制其實有點像Eve

Nginx簡單使用與詳解

nginx一、定義Nginx是一個反向代理服務器，所謂反向代理服務器就是當客戶端要請求服務器時，在他們之間加一個代理服務器，當客戶端請求時，先請求代理服務器，代理服務器通過防火墻連接到服務器代理服務器介於客戶端與服務器之間，相當於一個中間人或中介人下圖為關系圖：用戶A始終認為它訪問的是原始服務器B而不是代理服

Linux入門及命令詳解

linux入門、date、echo一、用戶登錄 root用戶 ① 一個特殊的管理賬戶； ②又叫超級管理員； ③對系統的損害有無限的能力； ④除非必要，否則不要用root登錄；普通用戶 ①權限有限； ②造成系統損害

用戶和組管理命令介紹與詳解

linux 命令用戶管理命令：useradd,userdel,usermod,passwd,chsh.chfn,finger,id,chageUseradd（建立用戶）useradd [options] USERNAME 例：useradd -g mygroup user2建立一個

wav文件格式分析與詳解

操作量化可用存在進制不同都是單純 _for WAV文件是在PC機平臺上很常見的、最經典的多媒體音頻文件,最早於1991年8月出現在Windows 3.1操作系統上,文件擴展名為WAV,是WaveFom的簡寫,也稱為波形文件,可直接存儲聲音波形,還原的波形曲線十

linux下iptables命令的應用與詳解

iptables 一、iptables的規則表和鏈。表（tables）提供特定的功能，iptables內置了4個表，即filter表、nat表、mangle表和raw表，分別用於實現包過濾，網絡地址轉換、包重構(修改)和數據跟蹤處理。鏈（chains）是數據包傳播的路徑，每一條鏈其實就是眾多規則中的

[轉]springmvc+mybatis需要的jar包與詳解

bat 簡單的 ive json lan -c 訪問動態 bject 1、antlr-2.7.6.jar: 項目中沒有添加,hibernate不會執行hql語句 2、Aopalliance.jar: 這個包是AOP聯盟的API包，裏面包含了針對面向切面的接口，通常Spr

python入門函數詳解

class gre href 開始人生苦短 http htm div targe 人生苦短，我用Python,接下來我們開始數據類型的學習當你覺得自己要放棄的時候，想想當初為什麽要學習python 一：python函數入門 python入門函數詳解

詳解Spring框架的核心思想之IOC

要素資源 tps etom ext rop word oct 這就是微信號：GitShare微信公眾號：愛折騰的稻草如有問題或建議，請在公眾號留言[1]前續為幫助廣大SpringBoot用戶達到“知其然，更需知其所以然”的境界，作者將通過SpringBoot系列文章全方

yum源配置與詳解

gpgkey med mode metadata 查看 grep arch ever manager 一、yum簡介yum是解決rpm軟件包的依賴性而開發的一種軟件包管理器。yum 的宗旨是自動化地升級，安裝/移除rpm 包，收集rpm 包的相關信息，檢查依賴性並自動提示用

Caffe入門例項與詳解 人工智慧框架

Caffe的幾個重要檔案

train.sh

資料準備

相關推薦

Caffe入門例項與詳解人工智慧框架