深度學習之卷積神經網路CNN及tensorflow程式碼實現示例

一、CNN的引入

在人工的全連線神經網路中，每相鄰兩層之間的每個神經元之間都是有邊相連的。當輸入層的特徵維度變得很高時，這時全連線網路需要訓練的引數就會增大很多，計算速度就會變得很慢，例如一張黑白的 28×28 的手寫數字圖片，輸入層的神經元就有784個，如下圖所示：

若在中間只使用一層隱藏層，引數 w 就有 784×15=11760 多個；若輸入的是28×28 帶有顏色的RGB格式的手寫數字圖片，輸入神經元就有28×28×3=2352 個…… 。這很容易看出使用全連線神經網路處理影象中的需要訓練引數過多的問題。

而在卷積神經網路（Convolutional Neural Network,CNN）中，卷積層的神經元只與前一層的部分神經元節點相連，即它的神經元間的連線是非全連線的，且同一層中某些神經元之間的連線的權重 w

和偏移 b 是共享的（即相同的），這樣大量地減少了需要訓練引數的數量。

卷積神經網路CNN的結構一般包含這幾個層：

輸入層：用於資料的輸入
卷積層：使用卷積核進行特徵提取和特徵對映
激勵層：由於卷積也是一種線性運算，因此需要增加非線性對映
池化層：進行下采樣，對特徵圖稀疏處理，減少資料運算量。
全連線層：通常在CNN的尾部進行重新擬合，減少特徵資訊的損失
輸出層：用於輸出結果

當然中間還可以使用一些其他的功能層:

歸一化層（Batch Normalization）：在CNN中對特徵的歸一化
切分層：對某些（圖片）資料的進行分割槽域的單獨學習
融合層：對獨立進行特徵學習的分支進行融合

二、CNN的層次結構

輸入層：

在CNN的輸入層中，（圖片）資料輸入的格式與全連線神經網路的輸入格式（一維向量）不太一樣。CNN的輸入層的輸入格式保留了圖片本身的結構。

對於黑白的 28×28 的圖片，CNN的輸入是一個 28×28 的的二維神經元，如下圖所示：

而對於RGB格式的28×28圖片，CNN的輸入則是一個 3×28×28 的三維神經元（RGB中的每一個顏色通道都有一個 28×28 的矩陣），如下圖所示：

卷積層：

在卷積層中有幾個重要的概念：

local receptive fields（感受視野）

shared weights（共享權值）

假設輸入的是一個 28×28 的的二維神經元，我們定義5×5 的一個 local receptive fields（感受視野），即隱藏層的神經元與輸入層的5×5個神經元相連，這個5*5的區域就稱之為Local Receptive Fields，如下圖所示：

可類似看作：隱藏層中的神經元具有一個固定大小的感受視野去感受上一層的部分特徵。在全連線神經網路中，隱藏層中的神經元的感受視野足夠大乃至可以看到上一層的所有特徵。

而在卷積神經網路中，隱藏層中的神經元的感受視野比較小，只能看到上一次的部分特徵，上一層的其他特徵可以通過平移感受視野來得到同一層的其他神經元，由同一層其他神經元來看：

設移動的步長為1：從左到右掃描，每次移動 1 格，掃描完之後，再向下移動一格，再次從左到右掃描。

具體過程如動圖所示：

可看出卷積層的神經元是隻與前一層的部分神經元節點相連，每一條相連的線對應一個權重 w 。

一個感受視野帶有一個卷積核，我們將感受視野中的權重 w 矩陣稱為卷積核；將感受視野對輸入的掃描間隔稱為步長（stride）；當步長比較大時（stride>1），為了掃描到邊緣的一些特徵，感受視野可能會“出界”，這時需要對邊界擴充(pad)，邊界擴充可以設為 0 或其他值。步長和邊界擴充值的大小由使用者來定義。

卷積核的大小由使用者來定義，即定義的感受視野的大小；卷積核的權重矩陣的值，便是卷積神經網路的引數，為了有一個偏移項，卷積核可附帶一個偏移項 b ，它們的初值可以隨機來生成，可通過訓練進行變化。

因此感受視野掃描時可以計算出下一層神經元的值為：

b+∑i=04∑j=04wijxij

對下一層的所有神經元來說，它們從不同的位置去探測了上一層神經元的特徵。

我們將通過一個帶有卷積核的感受視野掃描生成的下一層神經元矩陣稱為一個feature map (特徵對映圖)，如下圖的右邊便是一個 feature map：

因此在同一個 feature map 上的神經元使用的卷積核是相同的，因此這些神經元 shared weights，共享卷積核中的權值和附帶的偏移。一個 feature map 對應一個卷積核，若我們使用 3 個不同的卷積核，可以輸出3個feature map：（感受視野：5×5，布長stride：1）

因此在CNN的卷積層，我們需要訓練的引數大大地減少到了 (5×5+1)×3=78個。

假設輸入的是 28×28 的RGB圖片，即輸入的是一個

深度學習之卷積神經網路CNN及tensorflow程式碼實現示例

一、CNN的引入

二、CNN的層次結構

輸入層：

卷積層：

深度學習之卷積神經網路CNN及tensorflow程式碼實現示例詳細介紹

深度學習之卷積神經網路CNN及tensorflow程式碼實現示例

乾貨 | 深度學習之卷積神經網路(CNN)的模型結構

Udacity深度學習之卷積神經網路(CNN)

乾貨 | 深度學習之卷積神經網路（CNN）的前向傳播演算法詳解

深度學習：卷積神經網路CNN入門

深度學習之卷積神經網路入門（2）

【深度學習】卷積神經網路CNN基本知識點

深度學習之卷積神經網路原理詳解（一）

深度學習之卷積神經網路程式設計實現（二）

深度學習筆記-卷積神經網路CNN與迴圈神經網路RNN有什麼區別？

Udacity深度學習之卷積神經網路概念解析

深度學習之卷積神經網路

深度學習：Keras入門(二)之卷積神經網路(CNN)

深度學習：卷積神經網路物體檢測之感受野大小計算

【深度學習】卷積神經網路（CNN）

深度學習FPGA實現基礎知識10(Deep Learning（深度學習）卷積神經網路(Convolutional Neural Network，CNN))

深度學習：卷積神經網路，卷積，啟用函式，池化

深度學習筆記——卷積神經網路

深度學習基礎--卷積神經網路的不變性

深度學習之卷積神經網路CNN及tensorflow程式碼實現示例

一、CNN的引入

二、CNN的層次結構

輸入層：

卷積層：

相關推薦