[Notes]深度學習——caffe工具使用

阿新 • • 發佈：2019-02-09

本篇文章是我利用 caffe進行深度學習的知識點總結，包含別人學習筆記連結

caffe簡介

caffe的作者為UC Berkeley大學的賈揚清。caffe是一個c++/CUDA架構，支援命令列、Python、Matlab介面，可以在CPU/GPU上執行。

Caffe專案的檔案結構

caffe（要編譯的檔案，裡面包含用c++寫的資料輸入、網路層、計算等核心檔案）
data （要處理或者轉換的資料）

models：

train.prototxt (網路模型)
solve.prototxt（設定訓練的一系列引數）
xxx.caffemodel（finetune 時用的初始化引數，訓練新模型則不需要）

scripts（訓練網路的程式碼，可以是python檔案，shell檔案等）

caffe 網路結構

caffe 使用Blob陣列結構來儲存、交換、處理網路(就像numpy的儲存結構為narray)，用caffe Layer來定義神經網路結構，它包含資料層、視覺層等型別

下面以程式碼為例，講解常用層

train.prototxt（以下為VGG16模型部分程式碼）

資料層

name: "VGG16" 
layer { 
name: "data" 
type: "Data" #輸入的資料型別
top: "data" 
top: "label" 
include { 
phase: TRAIN 
} 
#資料預處理，來增強資料
transform_param { 
mirror: true 
crop_size: 224 
mean_value: 103.939 
mean_value: 116.779 
mean_value: 123.68 
} 
data_param { 
source: "data/ilsvrc12_shrt_256/ilsvrc12_train_leveldb" #資料庫檔案路徑
batch_size: 64 #網路單次輸入資料數量
backend: LEVELDB #選擇使用LevelDB還是LMDB
} 
}

caffe支援輸入的資料型別：

type	data
Data	LMDB/levelDB
MemoryData	記憶體資料
HDF5Data	HDF5資料
ImagesData	影象資料Images
WindowsData	視窗Windows

top:表示輸出的方向,bottom:表示輸入的資料來源（層的名稱），可以有多個top和bottom

注意：在資料層中，至少有一個命名為data的top。如果有第二個top，一般命名為label

卷積層

layer { 
bottom: "data" 
top: "conv1_1" 
name: "conv1_1" 
type: "Convolution" 
param { 
lr_mult: 1 
decay_mult: 1 
} 
param { 
lr_mult: 2 
decay_mult: 0 
} 
convolution_param { 
num_output: 64 
pad: 1 
kernel_size: 3 
weight_filler { 
type: "gaussian" 
std: 0.01 
} 
bias_filler { 
type: "constant" 
value: 0 
} 
} 
}

引數

num_output	卷積核數量
kernel_size	卷積核高度/寬度（可分別設定寬高）
weight_filler	引數初始化方案
bias_term	是否給卷積輸出新增偏置項
pad	影象周圍補0的畫素個數
stride	滑動步長
group	指定分組卷積操作的組數
lr_mult	學習率(最終的學習率要乘以 solver.prototxt 配置檔案中的 base_lr)
decay_mult	權值衰減
dropout_ratio	丟棄資料的概率
-	-

dropout_ratio和decay_mult設定為了防止資料過擬合

池化層

layer { 
bottom: "pool1" 
top: "conv2_1" 
name: "conv2_1" 
type: "Convolution" 
param { 
lr_mult: 1 
decay_mult: 1 
} 
param { 
lr_mult: 2 
decay_mult: 0 
} 
convolution_param { 
num_output: 128 
pad: 1 
kernel_size: 3 
weight_filler { 
type: "gaussian" 
std: 0.01 
} 
bias_filler { 
type: "constant" 
value: 0 
} 
} 
}

引數
pool	池化方式，Max:最大池化，AVE：均值池化，STOCHASTIC：隨機池化

啟用層

損失函式層

layer { 
bottom: "fc8" 
bottom: "label" 
top: "loss" 
name: "loss" 
type: "SoftmaxWithLoss" 
}

type
SoftmaxWithLoss	交叉資訊熵損失函式
Softmax	多分類損失函式

Caffe模型訓練

網路視覺化

當你寫好自己的prototxt檔案後，想要檢查自己的網路框架是否搭建正確，可以藉助 Netscope （線上caffe net視覺化工具）http://ethereon.github.io/netscope/#/editor

訓練引數設定

caffe模型的訓練引數在solve.prototxt檔案中，該檔案是caffe的核心，它交替呼叫前向演算法和反向傳播演算法來更新引數，使loss的值達到最小

net: "train_val.prototxt"
test_iter: 833
# make test net, but don't invoke it from the solver itself
test_interval: 1000
display: 200
average_loss: 100
base_lr: 1e-5
lr_policy: "step"
gamma: 0.1
stepsize: 5000
# lr for unnormalized softmax -- see train_val definition
# high momentum
momentum: 0.9
# no gradient accumulation
clip_gradients: 10000
iter_size: 1
max_iter: 80000
weight_decay: 0.02
snapshot: 4000
snapshot_prefix: "weight/VGG_item"
test_initialization: false

引數
train_net	訓練所需網路模型（最好寫絕對路徑）
test_net	測試所需網路模型
test_iter	測試次數（test_iter * batchsize = 訓練的資料量)
base_lr	基本學習率
lr_policy	學習率改變的方法
weight_decay	權重衰減
momentum	表示上一次梯度更新的權重
max_iter	最大迭代次數
snapshot	儲存模型間隔
snapshot_prefix	儲存模型路徑+字首
solver_mode	是否使用GPU
average_loss	取多次foward的loss作平均，進行顯示輸出
type	優化演算法

訓練網路

1、命令列

我們可以在命令列輸入程式碼訓練網路

./build/tools/caffe train -solver solver.prototxt

2、python

我們也可以利用caffe的python介面來編寫訓練網路的程式

其他問題

輸入輸出大小

在用自己的資料訓練或者微調網路的過程中，可能會出現img 與label_img大小不同的情況，這個時候就仔細分析訓練過程所顯示的每一層輸入輸出的大小，更改相應的引數使最後訓練的img與label_img大小相同

卷積核與池化層輸出影象尺寸計算公式：

（W-F+2P）/S+1

引數	說明
w	輸入影象大小
F	卷積核尺寸（kernel_size）
S	步幅大小（stride）
P	padding大小(pad)

[Notes]深度學習——caffe工具使用

本篇文章是我利用 caffe進行深度學習的知識點總結，包含別人學習筆記連結 caffe簡介 caffe的作者為UC Berkeley大學的賈揚清。caffe是一個c++/CUDA架構，支援命令列、Python、Matlab介面，可以在CPU/GPU上執行。 Caffe專

openSUSE 多個GPU設置深度學習 Caffe PyTorch 等

div 深度學習學習正常 gpo 原來 caf 顯示 nvi 原來只有一張卡Titian x，最近又添加一個1080TI，插好以後 nvidia-smi 顯示只有一張卡。看了下\dev 下nvidia1普通用戶沒有權限，切換到root下正常。但是在root下還是不太好

深度學習caffe搭建

經過一個月的時間，從開始接觸深度學習到環境搭建終於成功了！發表第一篇部落格慶祝一下按照21天實戰caffe 進行架構搭建出現的錯誤大致的解決辦法， Ubuntu用的是14.04 在進行依賴包glog下載由於google的限制需要翻牆很麻煩我直接在CSDN裡下載的依

深度學習caffe(4)——caffe配置（GPU）

電腦：win7 64位，NVIDIA GeForce GTX1080 Ti，visual studio 2013. 深度學習caffe(1)——windows配置caffe（vs2013+python+matlab）(cpu)：系統：window，系統版本是7

深度學習—caffe製作lmdb資料來源

前提：ubuntu系統，安裝了caffe，python。 Caffe深度學習訓練網路模型需要的資料的格式分三種，資料直接來源於圖片，使用lmdb資料來源，使用hdf5資料來源。本文件把圖片製作成lmdb資料來源首先任何位置新建資料夾：比如我新建了xytest

深度學習Caffe實戰筆記（2）用LeNet跑車牌識別資料

caffe實戰之“車牌識別” 上一篇部落格寫了如何在cpu的情況下配置環境，配置好環境後編譯成功，就可以用caffe框架訓練卷積神經網路了。今天介紹如何在caffe環境下，跑車牌識別的資料，利用的網路是LeNet，這裡只介紹具體caffe實戰步驟，網路結構不做

出入深度學習caffe框架上手教材推薦

博主小白，這段時間在搞深度學習，也沒有人帶我，就靠自己看看書和網上琢磨琢磨。一開始的時候，總是想快速入門深度學習。所以這裡推薦一本《深度學習21天實戰caffe》這本書，但是這本書有個不好的一點是，它前面的初章和中章都是寫的windows+cpu平臺下的開發，可是裡面給

深度學習Caffe實戰筆記（10）Windows Caffe使用MATLAB介面提取和視覺化特徵

上一篇部落格中介紹瞭如何使用MATLAB訓練和測試資料，這篇部落格介紹如何從訓練好的模型中提取影象特徵，並介紹把卷積層特徵視覺化方法。之前提取特徵都是用python，儘管用python提取特徵很方便，但是感覺MATLAB提取特徵更方便，因為博主對MATLAB

深度學習Caffe實戰（9）Windows 平臺caffe用MATLAB介面實現訓練網路和測試

上一篇介紹了網路協議中各個引數的作用，知道了各個引數的作用，想必應該可以嘗試修改網路結構了。前幾篇部落格介紹的都是用命令列訓練和測試網路，這篇部落格介紹如何用MATLAB介面實現訓練和測試網路，window平臺下caffe使用者本來就少，這方面的資料更少了，下一

Ubuntu14.04上深度學習Caffe庫安裝指南（CUDA7.5 + opencv3.1）

Ubuntu14.04上Caffe安裝指南安裝的準備工作首先，安裝官方版Caffe時，如果要使用Cuda，需要確認自己確實有NVIDIA GPU。安裝Ubuntu時，將/boot 分割槽分大概200M左右，太小了會導致升級系統時/boot空間不足

深度學習Caffe實戰筆記（21）Windows平臺 Faster-RCNN 訓練好的模型測試資料

前一篇部落格介紹瞭如何利用Faster-RCNN訓練自己的資料集，訓練好會得到一個模型，這篇部落格介紹如何利用訓練好的模型進行測試資料。 1、訓練好的模型存放位置訓練好的模型存放在faster_rcnn-master\output\faster_rcnn_

深度學習caffe實戰筆記（4）Windows caffe平臺下跑cifar10

上一篇部落格介紹瞭如何用alexnet跑自己的資料，能跑自己的資料按理說再跑cifar10應該沒問題了啊，但是想想還是要把cifar10的記錄下來，因為cifar10資料格式是屬於特殊的資料格式，需要用caffe環境把資料轉換檔案編譯出來，這也是後面Siames

Windows系統下安裝深度學習Caffe軟體及實現MATLAB呼叫的詳細步

下載Caffe，並解壓出原始碼資料夾caffe-master，轉到該資料夾下的windows資料夾下，將CommonSettings.props.example檔案複製到該目錄下並重命名為CommonSettings.props。用文字方式或者VS 2013單獨開啟，修改如下

深度學習Caffe實戰筆記（20）Windows平臺 Faster-RCNN 訓練自己的資料集

1、把自己的資料集放到Faster-master中我覺得這個過程是最重要的一個過程吧，博主在這裡跳了很多的坑，最後找到了一個非常簡單高效的方法。不用修改任何檔案，就可以輕鬆實現載入自己的資料集。在faster_rcnn-master資料夾下，有一個d

GitHub上深度學習Caffe開源程式程式碼

Caffe Caffe is a deep learning framework made with expression, speed, and modularity in mind. It is developed by the Berkeley Vision

深度學習caffe平臺--製作自己.lmdb格式資料集及分類標籤檔案

caffe對於訓練資料格式，支援：lmdb、h5py……，其中lmdb資料格式常用於單標籤資料，像分類等，經常使用lmdb的資料格式。對於迴歸等問題，或者多標籤資料，一般使用h5py資料的格式。當然好像還有其它格式的資料可用，本文就主要針對lmdb資料格式的製作方法，進行簡

深度學習caffe實戰筆記（13）利用MATLAB視覺化mnist資料集

之前的部落格中介紹過利用MATLAB視覺化影象特徵，因為最近在看《深度學習21天實戰caffe》，裡面有一章節是關於視覺化的，所以把視覺化mnist資料集的程式碼共享一下，在這裡要感謝趙永科老師 clc; clear; close all; image_fil

深度學習caffe平臺-----裁剪層（Crop Layer)引數及引數詳解

在Fully Convolutional Networks（FCN）中，會用到Crop 層，他的主要作用是進行裁切。下面我們舉一個例子來說明如何使用Crop 層。　　Caffe中的資料是以 blobs形式存在的，blob是四維資料，即（Batch s

深度學習Caffe實戰筆記（3）用AlexNet跑自己的資料

上一篇部落格介紹瞭如何在caffe框架平臺下，用LeNet網路訓練車牌識別資料，今天介紹用AlexNet跑自己的資料，同樣基於windows平臺下，會比基於Ubuntu平臺下麻煩一些，特別是後面的Siamese網路，說起Siamese網路真是一把辛酸一把淚啊，先

使用深度學習Caffe框架的C++介面進行物體分類

實現目標： 1、載入一張圖片，應用深度學習框架Caffe訓練好的模型分類圖片，顯示圖片的類別，輸出到控制檯； 2、載入一個資料夾，分類所有資料夾內的圖片，非圖片檔案選擇無視，生成同名txt儲存所屬類別。 3、工程project實現一、/home/name/ca

[Notes]深度學習——caffe工具使用

caffe簡介

Caffe專案的檔案結構

caffe 網路結構

Caffe模型訓練

其他問題

相關推薦