CNN神經網路之卷積操作

阿新 • • 發佈：2019-07-19

在看這兩個函式之前，我們需要先了解一維卷積(conv1d)和二維卷積(conv2d)，二維卷積是將一個特徵圖在width和height兩個方向進行滑動視窗操作，對應位置進行相乘求和；而一維卷積則只是在width或者height方向上進行滑動視窗並相乘求和。

一維卷積：tf.layers.conv1d()

tf.layers.conv1d(
    inputs,
    filters,
    kernel_size,
    strides=1,
    padding='valid',
    data_format='channels_last',
    dilation_rate=1,
    activation=None,
    use_bias=True,
    kernel_initializer=None,
    bias_initializer=tf.zeros_initializer(),
    kernel_regularizer=None,
    bias_regularizer=None,
    activity_regularizer=None,
    kernel_constraint=None,
    bias_constraint=None,
    trainable=True,
    name=None,
    reuse=None
)

引數：^[1]

inputs：張量資料輸入，一般是[batch, width, length]
filters：整數，輸出空間的維度，可以理解為卷積核_(濾波器)的個數
kernel_size：單個整數或元組/列表，指定1D_{(一維，一行或者一列)}卷積視窗的長度。
strides：單個整數或元組/列表，指定卷積的步長，預設為1
padding："SAME" or "VALID" _{(不區分大小寫)}是否用0填充，
- - SAME用0填充；
  - VALID不使用0填充，捨去不匹配的多餘項。
activation：啟用函式
ues_bias：該層是否使用偏差
kernel_initializer：卷積核的初始化

bias_initializer：偏置向量的初始化器
kernel_regularizer：卷積核的正則化項
bias_regularizer：偏置的正則化項
activity_regularizer：輸出的正則化函式
reuse：Boolean，是否使用相同名稱重用前一層的權重
trainable：Boolean，如果True，將變數新增到圖collection中
data_format：一個字串，一個channels_last（預設）或channels_first。輸入中維度的排序。
- - channels_last：對應於形狀的輸入(batch, length, channels)
  - channels_first：對應於形狀輸入(batch, channels, length)
name = 取一個名字

返回值：

　　一維卷積後的張量

例子

import tensorflow as tf 

x = tf.get_variable(name="x", shape=[32, 512, 1024], initializer=tf.zeros_initializer)
x = tf.layers.conv1d(
    x,
    filters=1,                    # 輸出的第三個通道是1
    kernel_size=512,            # 不用管它是多大，都不影響輸出的shape
    strides=1,
    padding='same',
    data_format='channels_last',
    dilation_rate=1,
    use_bias=True,
    bias_initializer=tf.zeros_initializer())

print(x)            # Tensor("conv1d/BiasAdd:0", shape=(32, 512, 1), dtype=float32)

解析：

輸入資料的維度為[batch, data_length, data_width]=[32, 512, 1024]，一般輸入資料input第一維為batch_size，此處為32，意味著有32個樣本，第二維度和第三維度分別表示輸入的長和寬（512，1024）
一維卷積核是二維的，也有長和寬，長為卷積核的數量kernel_size=512，因為卷積核的數量只有一個，所以寬為輸入資料的寬度data_width=1024，所以一維卷積核的shape為[512,1024]
filteres是卷積核的個數，即輸出資料的第三維度。filteres=1，第三維度為1
所以卷積後的輸出資料大小為[32, 512, 1]

二維卷積：tf.layers.conv2d()

tf.layers.conv2d(
    inputs,
    filters,
    kernel_size,
    strides=(1, 1),
    padding='valid',
    data_format='channels_last',
    dilation_rate=(1, 1),
    activation=None,
    use_bias=True,
    kernel_initializer=None,
    bias_initializer=tf.zeros_initializer(),
    kernel_regularizer=None,
    bias_regularizer=None,
    activity_regularizer=None,
    kernel_constraint=None,
    bias_constraint=None,
    trainable=True,
    name=None,
    reuse=None
)

引數：^[4]

inputs：張量輸入。一般是[batch, width, length]
filters：整數，輸出空間的維度，可以理解為卷積核_(濾波器)的個數
kernel_size：2個整數或元組/列表，指定2D卷積視窗的高度和寬度。可以是單個整數，以指定所有空間維度的相同值。
strides：2個整數或元組/列表，指定卷積沿高度和寬度方向的步幅。可以是單個整數，以指定所有空間維度的相同值。
padding："SAME" or "VALID" _{(不區分大小寫)}是否用0填充，
- - SAME用0填充；
  - VALID不使用0填充，捨去不匹配的多餘項。
data_format：字串，"channels_last"（預設）或"channels_first"。輸入中維度的排序。
- - channels_last：對應於具有形狀的輸入，(batch, height, width, channels)
  - channels_first：對應於具有形狀的輸入(batch, channels, height, width)
activation：啟用函式
use_bias：Boolean，該層是否使用偏差項
kernel_initializer：卷積核的初始化
bias_initializer：偏置向量的初始化。如果為None，將使用預設初始值設定項
kernel_regularizer：卷積核的正則化項
bias_regularizer：偏置向量的正則化項
activity_regularizer：輸出的正則化函式
trainable：Boolean，如果True，將變數新增到圖collection中
name：圖層的name
reuse：Boolean，是否使用相同名稱重用前一層的權重

　　二維卷積後的張量

例子：

import tensorflow as tf 

x = tf.get_variable(name="x", shape=[1, 3, 3, 5], initializer=tf.zeros_initializer)
x = tf.layers.conv2d(
    x,
    filters=1,                    # 結果的第三個通道是1
    kernel_size=[1, 1],            # 不用管它是多大，都不影響輸出的shape
    strides=[1, 1],
    padding='same',
    data_format='channels_last',
    use_bias=True,
    bias_initializer=tf.zeros_initializer())

print(x)            # shape=(1, 3, 3, 1)

解析：

input輸入是1張 3*3 大小的圖片，影象通道數是5，輸入shape=(batch, data_length， data_width， data_channel）
kernel_size卷積核shape是 1*1，數量filters是1strides步長是[1,1]，第一維和第二維分別為長度方向和寬度方向的步長 = 1。
最後輸出的shape為[1,3,3,1] 的張量，即得到一個3*3的feature map（batch，長，寬，輸出通道數）
長和寬只和strides有關，最後一個維度 = filters。

卷積層中的輸出大小計算

　　設輸入圖片大小W，Filter大小F，步長為S，padding為P，輸出圖片的大小為N：

$$N=\frac{W-F+2P}{S}+1$$

　　向下取整後再加1。

在Tensoflow中，Padding有2個選型，'SAME'和'VALID' ，下面舉例說明差別：

如果 Padding='SAME'，輸出尺寸為： W / S_{（向上取整）}

import tensorflow as tf

input_image = tf.get_variable(shape=[64, 32, 32, 3], dtype=tf.float32, name="input", initializer=tf.zeros_initializer)
conv0 = tf.layers.conv2d(input_image, 64, kernel_size=[3, 3], strides=[2, 2], padding='same')  # 32/2=16
conv1 = tf.layers.conv2d(input_image, 64, kernel_size=[5, 5], strides=[2, 2], padding='same')  
# kernel_szie不影響輸出尺寸
print(conv0)      # shape=(64, 16, 16, 64)
print(conv1)      # shape=(64, 16, 16, 64)

如果 Padding='VALID'，輸出尺寸為：(W - F + 1) / S

import tensorflow as tf

input_image = tf.get_variable(shape=[64, 32, 32, 3], dtype=tf.float32, name="input", initializer=tf.zeros_initializer)
conv0 = tf.layers.conv2d(input_image, 64, kernel_size=[3, 3], strides=[2, 2], padding='valid')  # (32-3+1)/2=15
conv1 = tf.layers.conv2d(input_image, 64, kernel_size=[5, 5], strides=[2, 2], padding='valid')  # (32-5+1)/2=14
print(conv0)      # shape=(64, 15, 15, 64)
print(conv1)      # shape=(64, 14, 14, 64)

參考文獻：

[1] tensorflow官方API tf.layers.conv1d

[2] tf.layers.conv1d函式解析（一維卷積）

[3] tf.layer.conv1d、conv2d、conv3d

[4] tensorflow官方API tf.layers.conv2d

CNN神經網路之卷積操作

在看這兩個函式之前，我們需要先了解一維卷積(conv1d)和二維卷積(conv2d)，二維卷積是將一個特徵圖在width和height兩個方向進行滑動視窗操作，對應位置進行相乘求和；而一維卷積則只是在width或者height方向上進行滑動視窗並相乘求和。一維卷積：tf.layers.conv1d()

卷積神經網路之卷積計算、作用與思想

部落格：blog.shinelee.me | 部落格園 | CSDN 卷積運算與相關運算在計算機視覺領域，卷積核、濾波器通常為較小尺寸的矩陣，比如$3\times3$、$5\times5$等，數字影象是相對較大尺寸的2維（多維）矩陣（張量），影象卷積運算與相關運算的關係如下圖所示（圖片來自連結）

深度學習：卷積神經網路，卷積，啟用函式，池化

卷積神經網路——輸入層、卷積層、啟用函式、池化層、全連線層 https://blog.csdn.net/yjl9122/article/details/70198357?utm_source=blogxgwz3 一、卷積層特徵提取輸入影象是32*32*3，3是它的深度（即R

卷積神經網路的卷積核的每個通道是否相同？

假設輸入資料的格式是[?,28,28,16],卷積核的尺寸是[3,3,16,32] 輸入資料的格式的含義是： &

【深度學習】卷積神經網路的卷積層和池化層計算

一、簡介 \quad\quad 卷積神經網路（Convolutional neural network, CNN），

吳恩達卷積神經網路——深度卷積網路：例項探究

經典網路 LeNet5 隨著網路的加深，影象的高度和寬度在縮小，通道數量增加池化後使用sigmoid函式 AlexNet 與LeNet相似，但大得多使用ReLu函式 VGG-16 網路大，但結構並不複雜影象縮小的比例和通道增加的比例是有規律的 64->

神經網路6_CNN(卷積神經網路)、RNN(迴圈神經網路)、DNN(深度神經網路)概念區分理解

sklearn實戰-乳腺癌細胞資料探勘(部落格主親自錄製視訊教程，QQ：231469242) https://study.163.com/course/introduction.htm?courseId=1005269003&utm_campaign=commission&utm

BP神經網路&卷積神經網路概念

1、BP神經網路 1.1 神經網路基礎神經網路的基本組成單元是神經元。神經元的通用模型如圖 1所示，其中常用的啟用函式有閾值函式、sigmoid函式和雙曲正切函式。圖 1 神經元模型神經元的輸出為： y=f(∑i=1m

卷積神經網路經過卷積之後的影象尺寸

設輸入影象尺寸為WW3，卷積核尺寸為F，步幅為S，Padding使用P,共有M個卷積核，則經過該卷積層後輸出的影象尺寸為： (W-F+2P)/S + 1 * (W-F+2P)/S + 1 * M 注意：共有M個卷積核，比如第一個卷積核

Neural Networks and Convolutional Neural Networks Essential Training 神經網路和卷積神經網路基礎教程 Lynda課程中文字幕

Neural Networks and Convolutional Neural Networks Essential Training 中文字幕神經網路和卷積神經網路基礎教程中文字幕Neural Networks and Convolutional Neural Networks

深層神經網路和卷積神經網路的反向傳播過程推導

反向傳播過程是深度學習的核心所在，雖然現在很多深度學習架構如Tensorflow等，已經自帶反向傳播過程的功能。我們只需要完成網路結構的正向傳播的搭建，反向傳播過程以及引數更新都是由架構本身來完成的。但為了更好的瞭解深度學習的機理，理解反向傳播過程的原理還是很重要的。在學

從神經網路到卷積神經網路的瞭解

date: 2016-09-14 11:02 老師提供的閱讀材，上週就應該看完，但還是沒看，這周需要看完然後看兩篇FNN的論文並做一個report。提供的材料是CS231n PS:才發現有翻譯，真真好人，我真真浪費時間t-T PPS

如何確定卷積神經網路的卷積核大小、卷積層數、每層map個數

卷積核大小卷積層數確定的原則是長而深，不知道怎麼就選3*3 三層3*3的卷積效果和一層7*7的卷積效果一致，我們知道一次卷積的複雜度是卷積長寬*影象長寬，3次卷積的複雜度為3*（3*3）*影象長寬《（7*7）*影象長寬，既然效果一樣，那當然選多次小卷積啊。卷積

Deep learning－全連線層神經網路與卷積神經網路

全連線層神經網路與卷積神經網路全連線層神經網路相比於卷積神經網路存在的問題：因為全連線，所以當相互連線的節點個數增加時，節點之間的邊個數會很多，而一條邊對應著一個引數，所以全連線層在神經網路節點個數多的時候會存在引數很多的情況。而對於神經網路引數過多帶來的影響有在計算上的，也有在模型的擬合程度

【神經網路】卷積層輸出大小計算（長、寬、深度）

先定義幾個引數輸入圖片大小 W×W Filter大小 F×F 步長 S padding的畫素數 P 於是我們可以得出 N = (W − F + 2P )/S+1 輸出圖片大小為 N×N 轉載：卷積中的特徵圖大小計算方式有兩種，分別是‘VALID’和‘SAM

Batch Normalization--全連線神經網路和卷積神經網路實戰

Batch Normalization原理網上部落格一大堆，說的也很明白，這裡就簡單的說一下我的個人理解：對每一個特徵值進行 0均值化，利於神經網路擬合時，對於自身的引數b，無需修改很多次，

神經網路及卷積神經網路的訓練——反向傳播演算法

神經網路的訓練過程，就是通過已有的樣本，求取使代價函式最小化時所對應的引數。代價函式測量的是模型對樣本的預測值與其真實值之間的誤差，最小化的求解一般使用梯度下降法（Gradient Decent）或其他與梯度有關的方法。其中的步驟包括：初始化引數。求代價

[深度學習]卷積神經網路：卷積、池化、常見分類網路

卷積全連線層：將卷積層所有的畫素展開，例如得到一個3072維的向量，然後在向量上進行操作。卷積層：可以保全空間結構，不是展開成一個長的向量。卷積操作：將卷積核從影象（或者上一層的feature map）的左上方的邊角處開始，遍歷卷積核覆蓋的所有畫素點。在每一個位置

卷積神經網路中卷積的OpenCL實現

卷積神經網路中卷積的OpenCL實現 ============================================================== 目錄 1、卷積 4、總結 ================================

神經網路中卷積層的堆疊

在神經網路的設計中，經常會出現多個卷積層堆疊的情況，（例如VGGNet）通過VGG16/19的結構圖可以看出，每一段使用了很多卷積層堆疊，然後再經過池化層，這其實是非常有用的設計。如下圖所示：兩個3x3

CNN神經網路之卷積操作

一維卷積：tf.layers.conv1d()

例子

二維卷積：tf.layers.conv2d()

引數：[4]

返回：

例子：

卷積層中的輸出大小計算

參考文獻：

相關推薦

引數：^[4]