Caffe下卷積神經網路中的一些特殊層

阿新 • • 發佈：2019-01-29

Caffe下卷積神經網路（CNN）中的一些特殊層

作者：xg123321123

Batch Normalization

意義：網路訓練時，用來加速收斂速度
提醒：
- 已經將BN整合為一個layer了，使用時需要和scale層一起使用
- 訓練的時候，將BN層的use_global_stats設定為false；測試的時候將use_global_stats設定為true，不然訓練的時候會報“NAN”或者模型不收斂 – 師兄的經驗，我還沒試驗過

Dropout

意義：防止模型過擬合；訓練模型時，隨機讓網路某些隱含層節點的權重不工作（不工作的那些節點可以暫時認為不是網路結構的一部分，但是它的權重得保留下來，只是暫時不更新而已，因為下次樣本輸入時它可能又得工作了）

用法：

layer {
name: “drop7”
type: “Dropout”
bottom: “fc7-conv”
top: “fc7-conv”
dropout_param {
dropout_ratio: 0.5
}
}

ReLU

意義：啟用函式的一種；對於給定的一個輸入值x，如果x > 0，ReLU層的輸出為x，如果x < 0，ReLU層的輸出為0。
提醒：可選引數negative_slope，此引數使得x < 0時，ReLU層的輸出為negative_slope * x；目前已經有了ReLU的進化版 –

PReLU
用法：

layer {
name: “relu1”
type: “ReLU”
bottom: “conv1”
top: “conv1”
relu_param{
negative_slope: [預設：0]
}
}

PReLU

意義： ReLu的進化版；。
提醒：在負半軸的輸出乘以一個係數，而這個係數是可學習的（你可以為其指定學習率），其中value是係數的初始值，channel_shared指定是否在各個通道間共享這個係數。據說有的實驗更快更好地收斂，但有的實驗準確率卻有所下降 - 具體效果還是得以具體實驗為準（自己沒有用過，不加評論
-用法：

layer {
name: “relu1”
type: “PReLU”
bottom: “conv1”
top: “conv1”
param {
lr_mult: 1
decay_mult: 0
}
prelu_param {
filler: {
value: 0.33 #: 預設為0.25
}
channel_shared: false
}
}

Split

意義：將一份blob複製為n份
提醒： caffe會隱式地做這個操作，我也不知道什麼時候會顯式地用到這個操作，先擱這兒吧(沒實際用過這個操作，所以下面的用法不一定對）
用法：

layer {
name: “split”
type: “split”
bottom: “rois”
top: “rois1”
top: “rois2”
}

Reshape

意義：改變blob的維度，而不改變其自身的資料
提醒：每個blob為4維，故有4個dim引數【0代表不改變維度的值，-1代表由caffe計算出值，正數代表將維度更改為對應的值】

layer {
name: “reshape”
type: “Reshape”
bottom: “conv1”
top: “conv1”
reshape_param {
shape {
dim: 0 # copy the dimension from below
dim: 2
dim: 3
dim: -1 # infer it from the other dimensions
}
}
}
注：若1個引數分別為 dim:1 dim:3 dim:2 dim:-1的reshape層，輸入為1個維度為1*2*3*4的blob，那麼輸出的blob維度為1*3*2*4（其中4是由caffe計算而來的）

InnerProduct

意義：將輸入資料以簡單的向量形式進行處理，並且輸出一個簡單的向量；簡單來說，這是一個卷積操作，只不過卷積核尺寸和feature map相同，故輸出向量大小為1*1
缺點：使用包含全連線層的模型(如AlexNet)必須使用固定大小的輸入，有時這是非常不合理的，因為必須對輸入圖片進行變形。
提醒：
- 必要引數：
  num_output (c_o)：濾波器數量
- 強烈建議引數：
  weight_filler：濾波器的初始分佈和分佈引數。
- 可選引數：
  bias_filler：[預設： type: ‘constant’ value: 0]
  bias_term：[預設：true] 指定是否在濾波器輸出之後學習並應用附加的偏置。
用法：

layer {
name: “fc8”
type: “InnerProduct”
bottom: “fc7”
top: “fc8”

param { # learning rate and decay multipliers for the weights
lr_mult: 1 decay_mult: 1
}

param { # learning rate and decay multipliers for the biases
lr_mult: 2 decay_mult: 0
}

inner_product_param {
num_output: 1000

weight_filler {
type: “xavier”
std: 0.01
}

bias_filler {
type: “constant”
value: 0
}
}
}
注：比如上面層的輸入為 n * c_i * h_i * w_i，那麼輸入為 n * 1000 * 1 * 1

Crop

意義：輸入兩個blob，將bottom[0] 按照bottom[1]的尺寸進行剪裁
提醒:
- axis=0,1,2,3分別表示為N,C,H,W；預設axis等於2，即預設從H開始裁剪（裁剪H和W）;可以只設置1個，也可以為每個dimension分別設定
- offset表示裁剪時的偏移量（如果還是不太清楚的話，戳這兒
用法：

layer {
type: “Crop”
name: ‘crop’
bottom: ‘score-dsn1-up’
bottom: ‘data’
top: ‘upscore-dsn1’
crop_param {
axis: 2
offset: 5
}
}

Caffe下卷積神經網路中的一些特殊層

對於卷積神經網路中全連線層的理解

全連線層的推導全連線層的每一個結點都與上一層的所有結點相連，用來把前邊提取到的特徵綜合起來。由於其全相連的特性，一般全連線層的引數也是最多的。全連線層的前向計算下圖中連線最密集的2個地方就是全連線層，這很明顯的可以看出全連線層的引數的確很多。在前向計算過程，也就是一個線性的加

變形卷積核、可分離卷積？卷積神經網路中十大拍案叫絕的操作

大家還是去看原文好，作者的文章都不錯： https://zhuanlan.zhihu.com/p/28749411 https://www.zhihu.com/people/professor-ho/posts 一、卷積只能在同一組進行嗎？-- Group convo

2013-2018卷積神經網路中十個最重要的概念與創新

本文作者Professor ho，原文載於其知乎主頁一、卷積只能在同一組進行嗎？– Group convolution Group convolution 分組卷積，最早在AlexNet中出現，由於當時的硬體資源有限，訓練AlexNet時卷積操作不能全部放在同一個GPU處理，因此作

卷積神經網路中感受野的理解和計算

什麼是感受野 “感受野”的概念來源於生物神經科學，比如當我們的“感受器”，比如我們的手受到刺激之後，會將刺激傳輸至中樞神經，但是並不是一個神經元就能夠接受整個面板的刺激，因為面板面積大，一個神經元可想而知肯定接受不完，而且我們同時可以感受到身上面板在不同的地方，如手、腳，的不同的刺激，如

卷積神經網路中十大拍案叫絕的操作

從2012年的AlexNet發展至今，科學家們發明出各種各樣的CNN模型，一個比一個深，一個比一個準確，一個比一個輕量。我下面會對近幾年一些具有變革性的工作進行簡單盤點，從這些充滿革新性的工作中探討日後的CNN變革方向。很棒的分享, 轉自 CVer 卷積

卷積神經網路中十大拍案叫絕的操作：卷積核大小好處、變形卷積、可分離卷積等

文章轉自：https://www.leiphone.com/news/201708/0rQBSwPO62IBhRxV.html 從2012年的AlexNet發展至今，科學家們發明出各種各樣的CNN模型，一個比一個深，一個比一個準確，一個比一個輕量。我下面會對近幾年一些具有變革性的工作進行簡單盤點

卷積神經網路中loss值為nan的問題（已解決）

卷積神經網路中loss值為nan的問題（已經解決了，請看最後的說明）最近一直在學習AI方面的東西。想自己搞一個類似MINST的東東，用搞基神經網路，樣本用自制的樣本……然鵝理想是骨感的，現實是永遠吃不上飯的。經過與各種錯誤輪戰後，出現了更大的錯誤：loss

卷積神經網路中1x1卷積的作用

1. 來源 [1312.4400] Network In Network （如果1×1卷積核接在普通的卷積層後面，配合啟用函式，即可實現network in network的結構） 2. 應用 GoogleNet中的Inception、ResNet中的殘差模組

盤點卷積神經網路中十大令人拍案叫絕的操作

轉載自https://www.jianshu.com/p/71804c97123d CNN從2012年的AlexNet發展至今，科學家們發明出各種各樣的CNN模型，一個比一個深，一個比一個準確，一個比一個輕量。我下面會對近幾年一些具有變革性的工作進行簡單盤點，從這些充滿革新性的工作中探討日後

巡禮卷積神經網路中的那些經典結構（二）——inception module

這篇文章向大家介紹一下inception module這個結構，在本文中我們只對inception module進行介紹，inception v1——v4系列文章會在後續文章中推出，請大家期待。本文轉載自磐創AI 一、Inception網路簡介 Inception網路又

巡禮卷積神經網路中的那些經典結構（一）—— Group convolution

筆者在閱讀論文的過程中，發現論文中經常會涉及到一些經典的神經網路結構，儘管這些結構可能出現的時間，但是生生不息，經歷住了時間的考驗。在這個系列文章中，我將對那些經典的網路分別做一個簡單介紹。作為這個系列文章的第一篇文章，本文首先要介紹的是 Group convolution這個結構

史上對tensorflow卷積神經網路中的padding引數最詳細解釋！

當使用tensorflow建立卷積神經網路時，肯定要用到卷積層和池化層，tendorflow關於建立卷積層和池化層的API都有padding這個引數，如下所示： - tf.nn.conv2d(input,filter,strides,padding) - tf.nn.max_pool(inp

tensorflow中卷積神經網路中步長stride的定義

在tensorflow中，卷積神經網路的使用方法如下： tf.nn.conv2d(input, filter, striders, padding, use_cudnn_on_gpu=None, name=None) 其中，步長stride是一個一維的向量，長度為4。形式是[a,x

卷積神經網路中10大拍案叫絕的操作

CNN從2012年的AlexNet發展至今，科學家們發明出各種各樣的CNN模型，一個比一個深，一個比一個準確，一個比一個輕量。我下面會對近幾年一些具有變革性的工作進行簡單盤點，從這些充滿革新性的工作中探討日後的CNN變革方向。注：水平所限，下面的見解或許有偏差，望大牛指正。另外只介紹其中具有代表性的模型，一些

手動實現卷積神經網路中的卷積操作（conv2d）

寫這個的原因：一來好像沒怎麼搜到別人手動實現，作為補充；二來鞏固一下基礎。卷積操作示意先從一張示意圖說起，卷積基礎概念和操作步驟就不囉嗦了，只講這張圖，大意就是，有in-channel，有out-channel，你需要把in-channel都做卷積操作，然

卷積神經網路中的四種基本元件

【導讀】當今，卷積神經網路在影象識別等領域取得巨大的成功，那麼是什麼使其高效而快速呢？本文整理John Olafenwa的一篇博文，主要介紹了卷積神經網路採用的四種基本元件：Pooling、Dropouts、Batch Normalization、Data Augment

卷積神經網路中不同型別的卷積方式介紹

之前在文章《<模型彙總_1>牛逼的深度卷積神經網路CNN》詳細介紹了卷積神經網路的基本原理，以及常見的基本模型，如LeNet，VGGNet，AlexNet，ReseNet，Inception Net的基本結構和原理。今天主要總結一下，卷積神經網路家族中，

卷積神經網路中的filter是怎麼工作的

首先，寫這個文件的原因是因為我轉載了一篇文章，不會編輯。擦。。。。 1. 首先收輸入層是毛東西？就是輸入的影象，有可能是三通道的有可能是單通道的。比如28*28*1或者28*28*3 分別代表的是大小為28*28，通道數分別為單通道和三通道的圖片 2.

對卷積神經網路中1*1 卷積的理解

Question: 從NIN 到Googlenet mrsa net 都是用了這個，為什麼呢？發現很多網路使用了1X1卷積核，這能起到什麼作用呢？另外我一直覺得，1X1卷積核就是對輸入的一個比例縮放，因為1X1卷積核只有一個引數，這個核在輸入上滑動，就相當於給輸入資料乘以一個係數。不知道我理解的是否正確。

Caffe下卷積神經網路中的一些特殊層

Caffe下卷積神經網路（CNN）中的一些特殊層

Batch Normalization

Dropout

ReLU

PReLU

Split

Reshape

InnerProduct

Crop

相關推薦