深度學習-圖片卷積輸出大小計算公式

阿新 • • 發佈：2018-12-12

輸入圖片經過卷積後所得特徵圖大小的計算公式：

先定義幾個引數

輸入圖片大小 W×W
Filter大小 F×F
步長 S
padding的畫素數 P
於是我們可以得出

N = (W − F + 2P )/S+1

輸出圖片大小為 N×N

如：輸入圖片的shape為[10,3,227,227]，對應輸入圖片大小為227x227

輸出num_output為96，對應通道數

Filter大小（kernel_size）為11，對應為11x11

步長S（stride）為4

N = (W − F + 2P )/S+1 = （227-11+2x0）/4 + 1 = 55

則輸出的特徵圖大小shape為[10,96,55,55].

多說一句：卷積核的個數等於輸出特徵圖的通道數。（這個一般都不會明確說出卷積核的個數）

反捲積得到的圖片大小計算方式：

反捲積的大小是由卷積核大小與滑動步長決定， in是輸入大小， k是卷積核大小， s是滑動步長， out是輸出大小
得到 out = (in - 1) * s + k

例如輸入：2x2，卷積核：4x4，滑動步長：3，輸出：7x7 ，其計算過程就是， (2 - 1) * 3 + 4 = 7

看到轉置卷積中存在指定padding的情況，如何計算特徵圖的大小。（假設padding為p）

out = （in - 1）* s - 2 * p + k （與上式不同的是需要減去兩倍的padding）

池化得到的特徵圖大小計算方式：

卷積向下取整，池化向上取整。

深度學習-圖片卷積輸出大小計算公式

輸入圖片經過卷積後所得特徵圖大小的計算公式：先定義幾個引數輸入圖片大小 W×W Filter大小 F×F 步長 S padding的畫素數 P 於是我們可以得出 N = (W − F + 2P )/S+1 輸出圖片大小為 N×N 如：輸入圖片的shape為[10,3,

深度學習：卷積神經網路物體檢測之感受野大小計算

1 感受野的概念　　在卷積神經網路中，感受野的定義是卷積神經網路每一層輸出的特徵圖（feature map）上的畫素點在原始影象上對映的區域大小。　　　　RCNN論文中有一段描述，Alexnet網路pool5輸出的特徵圖上的畫

深度學習基礎--卷積計算和池化計算公式

卷積計算和池化計算公式卷積卷積計算中，（）表示向下取整。輸入：n* c0* w0* h0 輸出：n* c1* w1* h1 其中，c1就是引數中的num_output，生成的特徵圖個數。 w1=(w0+2pad-kernel_size)/stride+1;

深度學習影象卷積後的尺寸計算公式

輸入圖片大小 W×W Filter大小 F×F 步長 S padding的畫素數 P 於是我們可以得出： N = (W − F + 2P )/S+1 輸出圖片大小為 N×N 如：輸入影象為5*5*3，Filter為3*3*3，在zero pad 為1，步長 S=1 （可先忽略這條

【深度學習】卷積神經網路的卷積層和池化層計算

一、簡介 \quad\quad 卷積神經網路（Convolutional neural network, CNN），

【深度學習】卷積計算與訓練模型的幾種方法

卷積計算全連線層和卷積層的根本區別在於：全連線層（Dense層）從輸入空間中學到的是全域性模式，而卷積層學到的是區域性模式。因為這個特性，所以卷積神經網路有兩個有趣的性質：平移不變性：卷積神經網路在影象右下角學到的某個模式，它可以在任何地方識別出來這個模式；而對

深度學習——深卷積網絡：實例探究

技術分享模塊變化技術減少開始出了經典問題： 1. 三個經典網絡紅色部分不重要，現在已經不再使用這篇文章較早，比如現在常用max，而當時用avg，當時也沒有softmax 這篇文章讓CV開始重視DL的使用，相對於LeNet-5，它的優點有兩個：更大，使用

深度學習-conv卷積

mage www. dep vol 才有 splay 變換還要 filter 過濾器(卷積核) 傳統的圖像過濾器算子有以下幾種: blur kernel：減少相鄰像素的差異，使圖像變平滑。 sobel：顯示相鄰元素在特定方向上的差異。 sharpen ：強化相鄰像素的差

深度學習之卷積自編碼器

一、自編碼器自編碼器（Autoencoder）是一種旨在將它們的輸入複製到的輸出的神經網路。他們通過將輸入壓縮成一種隱藏空間表示（latent-space representation），然後這種重構這種表示的輸出進行工作。這種網路由兩部分組成，如下圖：編碼器：將輸入壓縮為潛在空間

深度學習：卷積，反池化，反捲積，卷積可解釋性，CAM ,G_CAM

憑什麼相信你，我的CNN模型？（篇一：CAM和Grad-CAM)：https://www.jianshu.com/p/1d7b5c4ecb93 憑什麼相信你，我的CNN模型？（篇二：萬金油LIME)：http://bindog.github.io/blog/2018/02/11/model-ex

深度學習：卷積神經網路，卷積，啟用函式，池化

卷積神經網路——輸入層、卷積層、啟用函式、池化層、全連線層 https://blog.csdn.net/yjl9122/article/details/70198357?utm_source=blogxgwz3 一、卷積層特徵提取輸入影象是32*32*3，3是它的深度（即R

深度學習筆記——卷積神經網路

程式碼參考了零基礎入門深度學習(4) - 卷積神經網路這篇文章，我只對程式碼裡可能存在的一些小錯誤進行了更改。至於卷積神經網路的原理以及程式碼裡不清楚的地方可以結合該文章理解，十分淺顯易懂。 import numpy as np from functools import reduce fro

深度學習基礎--卷積神經網路的不變性

卷積神經網路的不變性不變性的實現主要靠兩點：大量資料（各種資料）；網路結構（pooling）不變性的型別 1）平移不變性卷積神經網路最初引入區域性連線和空間共享，就是為了滿足平移不變性。關於CNN中的平移不變性的來源有多種假設。一個想法是平移不變性

深度學習基礎--卷積--為什麼卷積核時4維的

為什麼卷積核時4維的因為本來就是4維的，input_channelkernel_sizekernel_size*output_channel 正常來說，引數的個數不是隻和卷積核大小及數量有關嗎，256個1通道的55的卷積核引數應該是256155吧，和輸入的特徵圖數量應該沒有

深度學習基礎--卷積--反捲積(deconvolution)

反捲積(deconvolution) 這個概念很混亂，沒有統一的定義，在不同的地方出現，意義卻不一樣。上取樣的卷積層有很多名字：全卷積（full convolution），網路內上取樣（ in-network upsampling），微步幅卷積（fractio

深度學習基礎--卷積--區域性連線層(Locally-Connected Layer)

區域性連線層(Locally-Connected Layer) locally-conv的概念來自傳統ML中的模型初始化（隨機樹方法中每個影象的crop都對應特定的一棵樹）。引數共享這個策略並不是每個場景下都合適的。有一些特定的場合，我們不能把圖片上的這些視窗資料都視作作用等同

深度學習基礎--卷積--加速的卷積運算

加速的卷積運算 convolution在GPU上如何實現，文中介紹了三種方法 1）最直觀的方法是直接實現（即一般的卷積運算）缺點：這種實現呢需要處理許多的corner case。文中介紹cuda-convnet2是實現了該種方法，該種方法在不同取值的卷積引數空間效

【深度學習】卷積神經網路

講卷積神經網路之前說說為什麼能夠進行分類識別？按照傳統的SIFT，HOG演算法都是先進行特徵的提取過程，那麼卷積神經網路怎麼進行特徵的提取呢？下面，我們就開始吧！先提一個小問題：“你是通過什麼瞭解這個世界的？” 當一輛汽車從你身邊疾馳而過，你是通過哪些資訊知道那是一

深度學習基礎--卷積--1D/2D/3D卷積簡介

1D/2D/3D卷積簡介他們處理的都是input tensor前幾個維度的資訊。 1）1D主要用於NLP中的N_gram，一維卷積又稱時域卷積。 2）2D和3D卷積用於影象。其中2D卷積處理的是一張影象，3D卷積處理的就是多張影象。3D卷積考慮時間

深度學習基礎--卷積--一般的卷積運算

一般的卷積運算 O是輸出input feature map，F是filter, D0是input feature map。從公式看到如果用迴圈操作，需要7次迴圈，n,k,p,q4次可獨立迴圈，c,r,s是累加操作的迴圈。

深度學習-圖片卷積輸出大小計算公式

輸入圖片經過卷積後所得特徵圖大小的計算公式：

反捲積得到的圖片大小計算方式：

池化得到的特徵圖大小計算方式：

相關推薦