深入理解卷積層，全連線層的作用意義

阿新 • • 發佈：2019-01-21

有部分內容是轉載的知乎的，如有侵權，請告知，刪除便是，但由於是總結的，所以不一一列出原作者是who。

再次感謝，也希望給其他小白受益。

首先說明：可以不用全連線層的。

理解1：

卷積取的是區域性特徵，全連線就是把以前的區域性特徵重新通過權值矩陣組裝成完整的圖。

因為用到了所有的區域性特徵，所以叫全連線。

理解2：

從卷積網路談起，卷積網路在形式上有一點點像咱們正在召開的“人民代表大會制度”。卷積核的個數相當於候選人，影象中不同的特徵會啟用不同的“候選人”（卷積核）。

池化層（僅指最大池化）起著類似於“合票”的作用，不同特徵在對不同的“候選人”有著各自的喜好。

全連線相當於是“代表普選”。所有被各個區域選出的代表，對最終結果進行“投票”，全連線保證了receiptive field 是整個影象，既影象中各個部分（所謂所有代表），都有對最終結果影響的權利。

理解3：

假設你是一隻小螞蟻，你的任務是找小麵包。你的視野還比較窄，只能看到很小一片區域。當你找到一片小麵包之後，你不知道你找到的是不是全部的小麵包，所以你們全部的螞蟻開了個會，把所有的小麵包都拿出來分享了。全連線層就是這個螞蟻大會~

理解4：

例如經過卷積，relu後得到3x3x5的輸出。

那它是怎麼樣把3x3x5的輸出，轉換成1x4096的形式？

很簡單,可以理解為在中間做了一個卷積。

從上圖我們可以看出，我們用一個3x3x5的filter 去卷積啟用函式的輸出，得到的結果就是一個fully connected layer 的一個神經元的輸出，這個輸出就是一個值。因為我們有4096個神經元。我們實際就是用一個3x3x5x4096的卷積層去卷積啟用函式的輸出。

以VGG-16再舉個例子吧，

對224x224x3的輸入，最後一層卷積可得輸出為7x7x512，如後層是一層含4096個神經元的FC，則可用卷積核為7x7x512x4096的全域性卷積來實現這一全連線運算過程。

它把特徵representation整合到一起，輸出為一個值。

這樣做,有一個什麼好處？就是大大減少特徵位置對分類帶來的影響。

舉個簡單的例子：

從上圖我們可以看出，貓在不同的位置，輸出的feature值相同，但是位置不同。

對於電腦來說，特徵值相同，但是特徵值位置不同，那分類結果也可能不一樣。

這時全連線層filter的作用就相當於

喵在哪我不管，我只要喵，於是我讓filter去把這個喵找到，

實際就是把feature map 整合成一個值，

這個值大，有喵，這個值小，那就可能沒喵

和這個喵在哪關係不大了，魯棒性有大大增強。

因為空間結構特性被忽略了，所以全連線層不適合用於在方位上找Pattern的任務，比如segmentation。

全連線層中一層的一個神經元就可以看成一個多項式，

我們用許多神經元去擬合數據分佈

但是隻用一層fully connected layer 有時候沒法解決非線性問題，

而如果有兩層或以上fully connected layer就可以很好地解決非線性問題了

我們都知道，全連線層之前的作用是提取特徵

全理解層的作用是分類

我們現在的任務是去區別一圖片是不是貓

假設這個神經網路模型已經訓練完了

全連線層已經知道

當我們得到以上特徵，我就可以判斷這個東東是貓了。

因為全連線層的作用主要就是實現分類（Classification）

從下圖，我們可以看出

紅色的神經元表示這個特徵被找到了（激活了）

同一層的其他神經元，要麼貓的特徵不明顯，要麼沒找到

當我們把這些找到的特徵組合在一起，發現最符合要求的是貓

ok，我認為這是貓了

當我們把這些找到的特徵組合在一起，發現最符合要求的是貓

ok，我認為這是貓了

貓頭有這麼些個特徵，於是我們下一步的任務

就是把貓頭的這麼些子特徵找到，比如眼睛啊，耳朵啊

道理和區別貓一樣

當我們找到這些特徵，神經元就被激活了（上圖紅色圓圈）

這細節特徵又是怎麼來的？

就是從前面的卷積層，下采樣層來的

全連線層引數特多（可佔整個網路引數80%左右）

那麼全連線層對模型影響引數就是三個：

1，全接解層的總層數（長度）
2，單個全連線層的神經元數（寬度）
3，啟用函式

首先我們要明白啟用函式的作用是：

增加模型的非線性表達能力

深入理解卷積層，全連線層的作用意義

深入理解卷積層，全連線層的作用意義

卷積神經網路全連線層轉換為卷積層獲得heatmap

卷積神經網路全連線層小結

CNN（卷積層convolutional layer，激勵層activating layer，池化層pooling，全連線層fully connected）

(轉載)感受野和座標對映的計算，以及卷積層跟全連線層的區別

CNN卷積層到全連線層的輸入格式變換錯誤 tf.reshape()和slim.flatten()

【深度學習筆記】關於卷積層、池化層、全連線層簡單的比較

卷積神經網路——輸入層、卷積層、啟用函式、池化層、全連線層

卷積神經網路入門一種全卷積神經網路（LeNet），從左至右依次為卷積→子取樣→卷積→子取樣→全連線→全連線→高斯連線測試最後，為了檢驗 CNN 能否工作，我們準備不同的另一組圖片與標記集（不能在訓練

利用tensorflow實現神經網路卷積層、池化層、全連線層

深入理解卷積層

深入理解“卷積”的概念

影象語義分割(2)-DeepLabV1: 使用深度卷積網路和全連線條件隨機場進行影象語義分割

深度學習基礎--卷積--1*1的卷積核與全連線的區別

深入理解卷積神經網路(CNN)——從原理到實現

如何理解“卷積運算”，在0-t時刻的所有輸入在所考察系統的疊加。要想看系統在哪個時刻的相應，就把t限制在哪個值

對於卷積神經網路中全連線層的理解

為什麼目標檢測中要將全連線層轉化為卷積層？

為什麼要將全連線層轉化為卷積層

為什麼使用卷積層替代CNN末尾的全連線層

深入理解卷積層，全連線層的作用意義

相關推薦