什麼是感受野
約定
感受野大小
感受野中心
小結
參考

部落格：部落格園 | CSDN | blog

什麼是感受野

The receptive field is defined as the region in the input space that a particular CNN’s feature is looking at (i.e. be affected by).

—— A guide to receptive field arithmetic for Convolutional Neural Networks

感受野（Receptive Field），指的是神經網路中神經元“看到的”輸入區域，在卷積神經網路中，feature map上某個元素的計算受輸入影象上某個區域的影響，這個區域即該元素的感受野。

卷積神經網路中，越深層的神經元看到的輸入區域越大，如下圖所示，kernel size 均為$3 \times 3$，stride均為1，綠色標記的是$Layer 2$ 每個神經元看到的區域，黃色標記的是$Layer 3$ 看到的區域，具體地，$Layer 2$每個神經元可看到$Layer 1$ 上 $3 \times 3$ 大小的區域，$Layer3$ 每個神經元看到$Layer 2$ 上 $3 \times 3$ 大小的區域，該區域可以又看到$Layer 1$ 上 $5 \times 5$ 大小的區域。

所以，感受野是個相對概念，某層feature map上的元素看到前面不同層上的區域範圍是不同的，通常在不特殊指定的情況下，感受野指的是看到輸入影象上的區域。

為了具體計算感受野，這裡借鑑視覺系統中的概念，
\[ receptive \ field = center + surround \]

準確計算感受野，需要回答兩個子問，即視野中心在哪和視野範圍多大。

只有看到”合適範圍的資訊”才可能做出正確的判斷，否則就可能“盲人摸象”或者“一覽眾山小”；
目標識別問題中，我們需要知道神經元看到是哪個區域，才能合理推斷物體在哪以及判斷是什麼物體。

但是，網路架構多種多樣，每層的引數配置也不盡相同，感受野具體該怎麼計算？

約定

在正式計算之前，先對數學符號做如下約定，

$k$：kernel size
$p$：padding size
$s$：stride size
$Layer$：用$Layer$表示feature map，特別地 $Layer \ 0$為輸入影象；
$Conv$：用$Conv$表示卷積，$k$、$p$、$s$為卷積層的超引數，$Conv \ l$的輸入和輸出分別為 $Layer \ l-1$ 和 $Layer \ l+1$；
$n$：feature map size為 $n \times n$，這裡假定$height = width$；
$r$：receptive field size為$r \times r$，這裡假定感受野為方形；
$j$：feature map上相鄰元素間的畫素距離，即將feature map上的元素與輸入影象$Layer \ 0$ 上感受野的中心對齊後，相鄰元素在輸入影象上的畫素距離，也可以理解為 feature map上前進1步相當於輸入影象上前進多少個畫素，如下圖所示，feature map上前進1步，相當於輸入影象上前進2個畫素，$j=2$；
$start$：feature map左上角元素在輸入影象上的感受野中心座標$(start, start)$，即視野中心的座標，在上圖中，左上角綠色塊感受野中心座標為$(0.5, 0.5)$，即左上角藍色塊中心的座標，左上角白色虛線塊中心的座標為$(-0.5, -0.5)$；
$l$：$l$表示層，卷積層為$Conv \ l$，其輸入feature map為$Layer \ l-1$，輸出為$Layer \ l$。

下面假定所有層均為卷積層。

感受野大小

感受野大小的計算是個遞推公式。

再看上面的動圖，如果feature map $Layer 2 $ 上的一個元素$A$看到feature map $Layer \ 1$ 上的範圍為$3 \times 3$（圖中綠色塊），其大小等於kernel size $k_2$，所以，$A$看到的感受野範圍$r_2$等價於$Layer \ 1$上$3 \times 3$視窗看到的$Layer \ 0$ 範圍，據此可以建立起相鄰$Layer$感受野的關係，如下所示，其中$r_{l}$為$Layer \ l$的感受野，$r_{l-1}$為$Layer \ l-1$ 的感受野，
\[ r_{l} = r_{l-1} + (k_{l} - 1) * j_{l-1} \]

$Layer \ l$ 一個元素的感受野$r_{l}$等價於$Layer \ l-1$ 上$k \times k$ 個感受野的疊加；
$Layer \ l-1$ 上一個元素的感受野為$r_{l-1}$；
$Layer \ l-1$ 上連續$k$ 個元素的感受野可以看成是，第1個元素看到的感受野加上剩餘$k-1$步掃過的範圍，$Layer \ l-1$ 上每前進1個元素相當於在輸入影象上前進$j_{l-1}$個畫素，結果等於$r_{l-1} + (k - 1) \times j_{l-1}$

視覺化如下圖所示，

下面的問題是，$j_{in}$怎麼求？

$Layer \ l$ 上前進1個元素相當於$Layer \ l-1$上前進$s_l$個元素，轉換成畫素單位為
\[ j_{l} = j_{l-1} \times s_{l} \]
其中，$s_l$為$Conv \ l$的kernel在$Layer \ l-1$ 上滑動的步長，輸入影象的$s_0 = 1$。

根據遞推公式可知，
\[ \begin{aligned}j_l &= \prod_{i=1}^{l} s_{i}\\\end{aligned} \]
$Layer \ l$上前進1個元素，相當於在輸入影象前進了$\prod_{i=1}^{l} s_{i}$個畫素，即前面所有層$stride$的連乘。

進一步可得，$Layer \ l$的感受野大小為
\[ \begin{aligned}r_{l} &= r_{l-1} + \left(k_{l}-1\right) * j_{l-1} \\&= r_{l-1}+\left(\left(k_{l}-1\right) * \prod_{i=1}^{l-1} s_{i}\right)\end{aligned} \]

感受野中心

感受野中心的計算也是個遞推公式。

在上一節中計算得$j_l = \prod_{i=1}^{l} s_{i}$，表示feature map $Layer \ l$上前進1個元素相當於在輸入影象上前進的畫素數目，如果將feature map上元素與感受野中心對齊，則$j_l$為感受野中心之間的畫素距離。如下圖所示，

其中，各層的kernel size、padding、stride超引數已在圖中標出，右側圖為feature map和感受野中心對齊後的結果。

相鄰$Layer$間，感受野中心的關係為
\[ start_{l} = start_{l-1} + (\frac{k_l - 1}{2} - p_l) * j_{l-1} \]
所有的$start$座標均相對於輸入影象座標系。其中，$start_0=(0.5,0.5)$，為輸入影象左上角畫素的中心座標，$start_{l-1}$表示$Layer \ l-1$左上角元素的感受野中心座標，$(\frac{k_l - 1}{2} - p_l)$為$Layer \ l$與$Layer \ l-1$感受野中心相對於$Layer \ l-1$座標系的偏差，該偏差需折算到輸入影象座標系，其值需要乘上$j_{l-1}$，即$Layer \ l-1$相鄰元素間的畫素距離，相乘的結果為$(\frac{k_l - 1}{2} - p_l) * j_{l-1}$，即感受野中心間的畫素距離——相對輸入影象座標系。至此，相鄰$Layer$間感受野中心座標間的關係就不難得出了，這個過程視覺化如下。

知道了$Layer \ l$左上角元素的感受野中心座標$(start_l, start_l)$，通過該層相鄰元素間的畫素距離$j_l$可以推算其他元素的感受野中心座標。

小結

將感受野的相關計算小結一下，
\[ \begin{aligned}j_{l} &= j_{l-1} \times s_{l} \\j_l &= \prod_{i=1}^{l} s_{i}\\r_{l} &= r_{l-1} + \left(k_{l}-1\right) * j_{l-1} \\&= r_{l-1}+\left(\left(k_{l}-1\right) * \prod_{i=1}^{l-1} s_{i}\right) \\start_{l} &= start_{l-1} + (\frac{k_l - 1}{2} - p_l) * j_{l-1}\end{aligned} \]
由上面的遞推公式，就可以從前向後逐層計算感受野了，程式碼可參見computeReceptiveField.py，線上視覺化計算可參見Receptive Field Calculator。

最後，還有幾點需要注意，

$Layer \ l$的感受野大小與$s_l$、$p_l$無關，即當前feature map元素的感受野大小與該層相鄰元素間的畫素距離無關；
為了簡化，通常將padding size設定為kernel的半徑，即$p = \frac{k-1}{2}$，可得$start_l = start_{l-1}$，使得feature map $Layer \ l$ 上$(x, y)$位置的元素，其感受野中心座標為$(x j_l, y j_l)$；
對於空洞卷積dilated convolution，相當於改變了卷積核的尺寸，若含有$dilation\ rate$引數，只需將$k_l$替換為$dilation \ rate * (k_l - 1) + 1$ ，$dilation\ rate=1$時為正常卷積；
對於pooling層，可將其當成特殊的卷積層，同樣存在kernel size、padding、stride引數；
非線性啟用層為逐元素操作，不改變感受野。

以上。

參考

wiki-Receptive field
wiki-Receptive Field Calculator
arXiv-Understanding the Effective Receptive Field in Deep Convolutional Neural Networks
medium-A guide to receptive field arithmetic for Convolutional Neural Networks
medium-Topic DL03: Receptive Field in CNN and the Math behind it
ppt-Convolutional Feature Maps: Elements of Efficient (and Accurate) CNN-based Object Detection
SIGAI-關於感受野的總結
Calculating Receptive Field of CNN

相關推薦

徹底搞懂感受野的含義與計算

目錄什麼是感受野約定感受野大小感受野中心小結參考部落格：部落格園 | CSDN | blog 什麼是感受野 The recepti

一文徹底搞懂卷積神經網路的“感受野”，看不懂你來找我！

一、什麼是“感受野” 1.1 感受野的概念 “感受野”的概念來源於生物神經科學，比如當我們的“感受器”，比如我們的手受到刺激之後，會將刺激傳輸至中樞神經，但是並不是一個神經元就能夠接受整個面板的刺激，因為面板面積大，一個神經元可想而知肯定接受不完，而且我們同

從一道面試題徹底搞懂hashCode與equals的作用與區別及應當注意的細節

public class HashCodeTest { public static void main(String[] args) { Collection set = new HashSet(); Point p1 = new Point(1, 1); Point p2 = new Poin

徹底搞懂Gradle、Gradle Wrapper與Android Plugin for Gradle的區別和聯絡

歡迎和大家交流技術相關問題：郵箱: [email protected] 部落格園地址: http://www.cnblogs.com/jiangxinnju GitHub地址: https://github.com/jiangxincode 知乎地址: https://www.zhihu.com/

徹底搞懂oracle的標量子查詢

article pop acc 問題 content 狀態 cat tracking varchar2 oracle標量子查詢和自己定義函數有時用起來比較方便，並且開發者也常常使用。數據量小還無所謂。數據量大，往往存在性能問題。下面測試幫助大家徹底搞懂標量子查

看完讓你徹底搞懂Websocket原理

找到說了成了原理兩層 cep 告訴 edi 純粹偶然在知乎上看到一篇回帖，瞬間覺得之前看的那麽多資料都不及這一篇回帖讓我對 websocket 的認識深刻有木有。所以轉到我博客裏，分享一下。比較喜歡看這種博客，讀起來很輕松，不枯燥，沒有布道師的陣仗，純粹為分享。廢

徹底搞懂反斜杠“”和正斜杠"/"的區別

影響使用 web應用圖片命令 mic ont http () 正斜杠，符號是"/";反斜杠，符號是"\"。在知乎中看到一個答案如下: 知乎用戶：“在絕大多數地方，用的都是/（slash），包括Mac/Linux，也包括URL。你唯一需要記住的是，Microsoft這

徹底搞懂Python的字符編碼

如果標點符號 decode 編號磁盤性能用處效果必須前言：中文編碼問題一直是程序員頭疼的問題，而Python2中的字符編碼足矣令新手抓狂。本文將盡量用通俗的語言帶大家徹底的了解字符編碼以及Python2和3中的各種編碼問題。一、什麽是字符編碼。要徹底解決字

徹底搞懂 Python 編碼

腳本文件 syntax 文件編碼一次 sci tail 關聯習慣 class 因為中文的特殊編碼，導致 Python2 和 Python3 使用過程中的各種編碼問題，如果不清楚其中的關聯關系，那麽這就一直是個大坑，不是懵逼就還是懵逼，所以就目前碰到的情況徹底梳理下 Py

轉--看完讓你徹底搞懂Websocket原理

接下來 lur 耗資源最終 ive img pro -- 傳遞偶然在知乎上看到一篇回帖，瞬間覺得之前看的那麽多資料都不及這一篇回帖讓我對 websocket 的認識深刻有木有。所以轉到我博客裏，分享一下。比較喜歡看這種博客，讀起來很輕松，不枯燥，沒有布道師的陣仗，純粹為

聽說看了這篇文章就徹底搞懂了什麽是OPC（上）

文檔 files 兩個 tool 共存硬件信息更改消息從2000年初以來，我們就一直在使用OPC軟件互操作性標準，而那些正準備踏入和想要踏入工業自動化領域的人們卻對這些含義感到困惑。所以在本中，我將系統地為你梳理OPC知識。 OPC首字母縮寫詞代表什麽？問一

一文徹底搞懂python中的self

在介紹Python的self用法之前，先來介紹下Python中的類和例項…… 我們知道，面向物件最重要的概念就是類（class）和例項（instance），類是抽象的模板，比如學生這個抽象的事物，可以用一個Student類來表示。而例項是根據類創建出來的一個個具體的“物件”，每一個物件都

徹底搞懂狀態機（一段式、兩段式、三段式）

例項：FSM實現10010串的檢測狀態轉移圖：初始狀態S0，a = 0,z = 0.如果檢測到1，跳轉到S1。下一狀態S1，a = 1,z = 0.如果檢測到0，跳轉到S2。 &nb

websocket(轉) 看完讓你徹底搞懂Websocket原理

看完讓你徹底搞懂Websocket原理偶然在知乎上看到一篇回帖，瞬間覺得之前看的那麼多資料都不及這一篇回帖讓我對 websocket 的認識深刻有木有。所以轉到我部落格裡，分享一下。比較喜歡看這種部落格，讀起來很輕鬆，不枯燥，沒有佈道師的陣仗，純粹為分享。廢話這麼多了，最後再贊一

徹底搞懂Java的值傳遞和引用傳遞

學過Java基礎的人都知道：值傳遞和引用傳遞是初次接觸Java時的一個難點，有時候記得了語法卻記不得怎麼實際運用，有時候會的了運用卻解釋不出原理，而且坊間討論的話題又是充滿爭議：有的論壇帖子說Java只有值傳遞，有的部落格說兩者皆有；這讓人有點摸不著頭腦，下面我們就這個話題做一些探討，對書籍、對論壇

一文徹底搞懂python的垃圾回收機制

一、什麼是記憶體管理和垃圾回收 Python GC主要使用引用計數（reference counting）來跟蹤和回收垃圾。在引用計數的基礎上，通過“標記-清除”（mark and sweep）解決容器物件可能產生的迴圈引用問題，通過“分代回收”（genera

徹底搞懂錯排公式

問題：現有10本書按照順序擺放，現要求重新排列，使得新的書的順序中每一本書都不在原來的位置，求有多少種排列方式？這個問題推廣一下，就是錯排問題，是組合數學中的問題之一。考慮一個有n個元素的排列，若一個排列中所有的元素都不在自己原來的位置上，那麼這樣的排列就稱為原排列的一個錯排。 n個元素的

徹底搞懂Scrapy的中介軟體（二）

在上一篇文章中介紹了下載器中介軟體的一些簡單應用，現在再來通過案例說說如何使用下載器中介軟體整合Selenium、重試和處理請求異常。在中介軟體中整合Selenium 對於一些很麻煩的非同步載入頁面，手動尋找它的後臺API代價可能太大。這種情況下可以使用Selenium和ChromeDriver或者Se

徹底搞懂Scrapy的中介軟體（三）

在前面兩篇文章介紹了下載器中介軟體的使用，這篇文章將會介紹爬蟲中介軟體（Spider Middleware）的使用。爬蟲中介軟體爬蟲中介軟體的用法與下載器中介軟體非常相似，只是它們的作用物件不同。下載器中介軟體的作用物件是請求request和返回response；爬蟲中介軟體的作用物件是爬蟲，更具體地

《從零構建前後分離的web專案》：前端終 - 徹底弄懂前端效能優化與上線 (多圖預警)

4000字長文，多圖預警！！！流量慎入！！效能優化 - 屌絲前端效能優化、上線一條龍大家好我又來了，本章給大家帶來的內容是：上線和上線後的效能優化專案地址實戰預覽地址實戰專案地址本章程式碼地址本章你會了解前端需要了解的 docker 基礎知識部署前端專

徹底搞懂感受野的含義與計算

什麼是感受野

約定

感受野大小

感受野中心

小結

參考

相關推薦