day-16 CNN卷積神經網路演算法之Max pooling池化操作學習

阿新 • • 發佈：2019-01-12

利用CNN卷積神經網路進行訓練時，進行完卷積運算，還需要接著進行Max pooling池化操作，目的是在儘量不丟失影象特徵前期下，對影象進行downsampling。

首先看下max pooling的具體操作：整個圖片被不重疊的分割成若干個同樣大小的小塊（pooling size）。每個小塊內只取最大的數字，再捨棄其他節點後，保持原有的平面結構得出 output。

相應的，對於多個feature map，操作如下，原本64張224X224的影象，經過Max Pooling後，變成了64張112X112的影象，從而實現了downsampling的目的。

為什麼可以這樣？這裡利用到一個特性：平移不變性(translation invariant)，結論的公式證明還無從考證，不過從下面的例項可以側面證明這點：

右上角為3副橫折位置不一樣的影象，分別同左上角的卷積核進行運算，然後再進行3X3大小池化操作以後，我們發現最後都能得到相同的識別結果。還有人更通俗理解卷積後再進行池化運算得到相同的結果，就好比牛逼的球隊分到不同的組得到獲得相同的比賽結果一樣。

除了Max Pooling，還有一些其它的池化操作，例如：SUM pooling、AVE pooling、MOP pooling、CROW pooling和RMAC pooling等，這裡不再進行介紹，見末尾參考文章連結。

下面利用tensorflow模組的max_pool函式，實現Max pooling操作：

# 匯入tensorflow庫
import tensorflow as tf

# 定義2個行為4，列為4，通道為1的資料集
batches = 2
height = 4
width = 4
channes = 1

dataset = tf.Variable(
    [
        [
            [[1.0],[2.0],[5.0],[6.0]],
            [[3.0],[4.0],[7.0],[8.0]],
            [[9.0],[10.0],[13.0],[14.0]],
            [[ 
11.0],[12.0],[15.0],[16.0]]
        ],
        [
            [[17.0],[18.0],[21.0],[22.0]],
            [[19.0],[20.0],[23.0],[24.0]],
            [[25.0],[26.0],[29.0],[30.0]],
            [[27.0],[28.0],[31.0],[32.0]]
        ]
    ])

# 定義Max pooling操作運算，重點理解下ksize和strides兩個引數的含義：
# ksize表示不同維度Max pooling的大小，由於batches和channels兩個維度不需要進行Max pooling，所以為1
# strides表示下個Max pooling位置的跳躍大小，同理，由於batches和channels兩個維度不需要進行Max pooling，所以為1
X = tf.placeholder(dtype="float",shape=[None,height,width,channes])
data_max_pool = tf.nn.max_pool(value=X,ksize=[1,2,2,1],strides=[1,2,2,1],padding="VALID")

# 開始進行tensorflow計算圖運算
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    input = sess.run(dataset)
    output = sess.run(data_max_pool,feed_dict = {X:input})
    print(input)
    print("===============================")
    print(output)
    

# 輸入：
# [
#   [
#     [[ 1.]   [ 2.]   [ 5.]   [ 6.]]
#     [[ 3.]   [ 4.]   [ 7.]   [ 8.]]
#     [[ 9.]   [10.]   [13.]   [14.]]
#     [[11.]   [12.]   [15.]   [16.]]
#   ]
# 
#  [
#     [[17.]   [18.]   [21.]   [22.]]
#     [[19.]   [20.]   [23.]   [24.]]
#     [[25.]   [26.]   [29.]   [30.]]
#     [[27.]   [28.]   [31.]   [32.]]
#   ]
# ]
# 
# ===============================
# 輸出：
# [
#   [
#     [[ 4.]   [ 8.]]
#     [[12.]   [16.]]
#   ]
#  [
#     [[20.]   [24.]]
#     [[28.]   [32.]]
#   ]
# ]

day-16 CNN卷積神經網路演算法之Max pooling池化操作學習

day-16 CNN卷積神經網路演算法之Max pooling池化操作學習

卷積神經網路物體檢測---空間金字塔池化的

Keras學習（四）——CNN卷積神經網路

CNN卷積神經網路簡單實現模型

【深度學習】Tensorflow——CNN 卷積神經網路 2

【深度學習】Tensorflow——CNN 卷積神經網路 1

TensorFlow之CNN卷積神經網路的實現

DeepLearning tutorial（4）CNN卷積神經網路原理簡介+程式碼詳解

Python CNN卷積神經網路程式碼實現

TensorFlow實現CNN卷積神經網路對手寫數字集mnist的模型訓練

CNN卷積神經網路入門整合

CNN-卷積神經網路

吳恩達deeplearning之CNN—卷積神經網路入門

詳細解釋CNN卷積神經網路各層的引數和連線個數的計算

CNN卷積神經網路原理的直觀理解

CNN卷積神經網路

[原始碼和文件分享]基於CUDA的卷積神經網路演算法實現

python神經網路案例——CNN卷積神經網路實現mnist手寫體識別

CNN卷積神經網路基礎

CNN卷積神經網路學習筆記1：背景介紹

day-16 CNN卷積神經網路演算法之Max pooling池化操作學習

相關推薦