【神經網路】卷積層輸出大小計算（長、寬、深度）

阿新 • • 發佈：2019-01-14

先定義幾個引數

輸入圖片大小 W×W
Filter大小 F×F
步長 S
padding的畫素數 P

於是我們可以得出

N = (W − F + 2P )/S+1

輸出圖片大小為 N×N

轉載：

卷積中的特徵圖大小計算方式有兩種，分別是‘VALID’和‘SAME’，卷積和池化都適用，除不盡的結果都向上取整。

1.如果計算方式採用'VALID'，則：

其中為輸出特徵圖的大小，為輸入特徵圖的大小，F為卷積核大小，stride為卷積步長。

2.如果計算方式採用'SAME'，輸出特徵圖的大小與輸入特徵圖的大小保持不變，

其中padding為特徵圖填充的圈數。

若採用'SAME'方式，kernel_size=1時，padding=0；kernel_size=3時，padding=1；kernel_size=5時，padding=3，以此類推。

tensorflow程式碼（Tensorflow官方文件）中：

w_conv1=weight_variable([5,5,1,32])，一直不明白這個32是怎麼來的，表示的是什麼？

後來看到cs231n-知乎課程翻譯的卷積神經網那一章的一段話：

引數共享：在卷積層中使用引數共享是用來控制引數的數量。就用上面的例子，在第一個卷積層就有55x55x96=290,400個神經元，每個有11x11x3=364個引數和1個偏差。將這些合起來就是290400x364=105,705,600個引數。單單第一層就有這麼多引數，顯然這個數目是非常大的。

作一個合理的假設：如果一個特徵在計算某個空間位置(x,y)的時候有用，那麼它在計算另一個不同位置(x2,y2)的時候也有用。基於這個假設，可以顯著地減少引數數量。換言之，就是將深度維度上一個單獨的2維切片看做深度切片（depth slice），比如一個數據體尺寸為[55x55x96]的就有96個深度切片，每個尺寸為[55x55]。在每個深度切片上的神經元都使用同樣的權重和偏差。在這樣的引數共享下，例子中的第一個卷積層就只有96個不同的權重集了，一個權重集對應一個深度切片，共有96x11x11x3=34,848個不同的權重，或34,944個引數（+96個偏差）。

可以看出，上面的32表示的是卷積層輸出的深度，因為大家都明白width和height都可以通過公式計算得到，但是很多文獻都沒有告訴深度是如何得到的，下面是我的認識：

1. 因為這個深度是沒有公式可以計算出來的，因為深度是一個經驗值，如上面程式碼的32 ，其實是一個經驗值，是通過調整引數發現32是一個最合適的值，可以得到最好的準確率，但是不同的影象的深度是不一樣的。

2.這個深度表示用了多少個卷積核，下面這個圖可以說明一下：

上圖就可以很有效的說明：卷積層輸出的深度==卷積核的個數。

【神經網路】卷積層輸出大小計算（長、寬、深度）

【神經網路】卷積層輸出大小計算（長、寬、深度）

【python實現卷積神經網路】卷積層Conv2D實現（帶stride、padding）

【深度學習】卷積神經網路的卷積層和池化層計算

神經網路中卷積層的堆疊

【Deep learning】卷積神經網路CNN演算法原理

【深度學習】卷積層提速Factorized Convolutional Neural Networks

如何確定卷積神經網路的卷積核大小、卷積層數、每層map個數

Deep learning－全連線層神經網路與卷積神經網路

【神經網路】自編碼聚類演算法--DEC (Deep Embedded Clustering)

【計算機網路】資料鏈路層總結

深度學習：卷積神經網路，卷積，啟用函式，池化

卷積神經網路之卷積計算、作用與思想

卷積神經網路的卷積核的每個通道是否相同？

神經網路6_CNN(卷積神經網路)、RNN(迴圈神經網路)、DNN(深度神經網路)概念區分理解

BP神經網路&卷積神經網路概念

【計算機網路】資料鏈路層的代表協議PPP與區域網

卷積神經網路經過卷積之後的影象尺寸

Neural Networks and Convolutional Neural Networks Essential Training 神經網路和卷積神經網路基礎教程 Lynda課程中文字幕

深層神經網路和卷積神經網路的反向傳播過程推導

【神經網路】VGG、ResNet、GoogleLeNet、AlexNet等常用網路程式碼及預訓練模型

【神經網路】卷積層輸出大小計算（長、寬、深度）

相關推薦