1. 程式人生 > >深度學習-圖片卷積輸出大小計算公式

深度學習-圖片卷積輸出大小計算公式

輸入圖片經過卷積後所得特徵圖大小的計算公式:

先定義幾個引數

輸入圖片大小 W×W
Filter大小 F×F
步長 S
padding的畫素數 P
於是我們可以得出

N = (W − F + 2P )/S+1

輸出圖片大小為 N×N

如:輸入圖片的shape為[10,3,227,227],對應輸入圖片大小為227x227

輸出num_output為96,對應通道數

Filter大小(kernel_size)為11,對應為11x11

步長S(stride)為4

N = (W − F + 2P )/S+1 = (227-11+2x0)/4 + 1 = 55

則輸出的特徵圖大小shape為[10,96,55,55].

多說一句:卷積核的個數等於輸出特徵圖的通道數。(這個一般都不會明確說出卷積核的個數)

反捲積得到的圖片大小計算方式:

反捲積的大小是由卷積核大小與滑動步長決定, in是輸入大小, k是卷積核大小, s是滑動步長, out是輸出大小
得到 out = (in - 1) * s + k

例如 輸入:2x2, 卷積核:4x4, 滑動步長:3, 輸出:7x7 ,其計算過程就是, (2 - 1) * 3 + 4 = 7

看到轉置卷積中存在指定padding的情況,如何計算特徵圖的大小。(假設padding為p)

out = (in - 1)* s - 2 * p + k (與上式不同的是需要減去兩倍的padding)

池化得到的特徵圖大小計算方式:

卷積向下取整,池化向上取整。