深度學習-圖片卷積輸出大小計算公式
阿新 • • 發佈:2018-12-12
輸入圖片經過卷積後所得特徵圖大小的計算公式:
先定義幾個引數
輸入圖片大小 W×W
Filter大小 F×F
步長 S
padding的畫素數 P
於是我們可以得出
N = (W − F + 2P )/S+1
輸出圖片大小為 N×N
如:輸入圖片的shape為[10,3,227,227],對應輸入圖片大小為227x227
輸出num_output為96,對應通道數
Filter大小(kernel_size)為11,對應為11x11
步長S(stride)為4
N = (W − F + 2P )/S+1 = (227-11+2x0)/4 + 1 = 55
則輸出的特徵圖大小shape為[10,96,55,55].
多說一句:卷積核的個數等於輸出特徵圖的通道數。(這個一般都不會明確說出卷積核的個數)
反捲積得到的圖片大小計算方式:
反捲積的大小是由卷積核大小與滑動步長決定, in是輸入大小, k是卷積核大小, s是滑動步長, out是輸出大小
得到 out = (in - 1) * s + k
例如 輸入:2x2, 卷積核:4x4, 滑動步長:3, 輸出:7x7 ,其計算過程就是, (2 - 1) * 3 + 4 = 7
看到轉置卷積中存在指定padding的情況,如何計算特徵圖的大小。(假設padding為p)
out = (in - 1)* s - 2 * p + k (與上式不同的是需要減去兩倍的padding)
池化得到的特徵圖大小計算方式:
卷積向下取整,池化向上取整。