DeepLearning (六) 學習筆記整理：神經網路以及卷積神經網路

DeepLearning 已經持續火了一段時間，很多領域的 state-of-the-art 都被刷了一刷。這裡整理一下前段時間關於DeepLearning的學習筆記，主要是CNN以及Neural Networds方面的理解，如果有理解錯誤之處，還請不吝指出。

神經網路

首先從最簡單的神經網路說起，單獨一個神經元可以表示一個邏輯迴歸模型，表示公式為：hW,b(X)=f(WTX+b) ,圖示如下：

其表達的意思也就是權值向量 W 與輸入向量 X 相乘後加上偏置 b 經過啟用函式輸出,網路的輸出我們稱之為啟用值。由於啟用函式的非線性變換從而使得神經元具備表達非線性模型的能力。

如果我們將輸入 X 增加1維，值為1，那麼就可以將偏置 b 併入 W 中，表示式變為 hW(X)=f(WTX)

神經網路模型

所謂神經網路就是將許多個單一“神經元”聯結在一起，這樣，一個“神經元”的輸出就可以是另一個“神經元”的輸入。例如，下圖就是一個簡單的神經網路：

前向傳播

由上圖的網路模型，我們可以簡單用公式表達一些前向傳播的過程：
第一層：令 z(2)=W(1)x+b(1) , 則啟用值為： a(2)=f(z(2))
第二層：將第一層的輸出，也就是啟用值作為第二層的輸入。令 z(3)=W(2)a(2)+b(2)，則可以得到輸出層：
hW,b(x)=a(

3)=f(z(3))

以此類推，便是神經網路模型的前向傳播的過程。

反向傳播

先舉個栗子，假設我們有一個固定樣本集 {(x(1),y(1)),...(x(m),y(m))} 包含&m& 個樣例，我們可以用批量梯度下降演算法求解神經網路，定義整體代價函式為：

其中第一項 J(W,b) 是一個均方差項,第二項是一個規則化項（也叫權重衰減項），其目的是減小權重的幅度，防止過度擬合.

BP是後向傳播的英文縮寫，那麼傳播物件是什麼？傳播的目的是什麼？傳播的方式是後向，可這又是什麼意思呢

傳播的物件是誤差，傳播的目的是得到所有層的估計誤差，後向是說由後層的估計誤差推導前層估計誤差：

即BP的思想可以總結為：

利用輸出後的誤差來估計輸出層的直接前導層的誤差，再用這個誤差估計更前一層的誤差，如此一層一層的反傳下去，就獲得了所有其他各層的誤差估計。

BP神經網路模型拓撲結構包括輸入層（input）、隱層(hide layer)和輸出層(output layer)

神經網路的學習目的：

希望能夠學習到一個模型，能夠對輸入輸出一個我們期望的輸出。

學習的方式：

在外界輸入樣本的刺激下不斷改變網路的連線權值

學習的本質：

對各連線權值的動態調整

學習的核心：

權值調整規則，即在學習過程中網路中各神經元的連線權變化所依據的一定的調整規則。

BP的核心思想就是：

將輸出誤差以某種形式通過隱層向輸入層逐層反傳

BP演算法的具體推導可以參考UFLDL

Neural Networds: Tips and Tricks

Gradient Check

用梯度的原始定義來逼近BP誤差傳遞演算法以達到檢驗BP演算法的實現是否正確，在UFLDL中經常會做這樣的檢驗。

用法：

定義 h 為一個很小的值，然後將輸入 θ 替換為 θ+h 進行前向傳播，得到 J(θ+h)

將輸入 θ 替換為 θ−h 進行前向傳播，得到 J(θ−h)

計算 (J(θ+h)−J(θ−h))/2h 的值，與BP演算法反饋回來的值進行比較，兩者相差是 10−9 或更小則可以認為BP演算法正確實現

Regularization

像大多數分類器，神經網路也會出現過擬合的現象，這將會導致神經網路的交叉驗證以及測試準確率下降。這時我們依舊可以使用 L2 範數進行正則化。此時的 loss Function 如下：
JR=J+λ∑i=1L||W(i)||F

新增這個約束項可以懲罰那些會造成 JR 過大的 W ,也可以減輕網路的複雜性。

懲罰那些會造成 JR 過大的 W 很容易理解，就是在減小 JR 的同時也減小那些比較大的 W 。

減輕網路的複雜性可以用先驗貝葉斯信念( prior Bayesian belief ) 來解釋：先驗貝葉斯信念認為，優化後的權重 W 應該是非常接近0的。那麼要多接近呢？這就要根據 λ 的值來確定，λ 的值越大，就有越多的 W 被優化為 0，此時網路中有效的 w 就變少了，相當於去掉了這部分 w 為 0 的網路，此時的網路就變得比較輕盈了。

然而需要注意的是，我們只對權重 W 進行正則化而不對 bias b 進行正則化，因為 b 對網路的複雜性以及過擬合都沒有影響。

加入權重懲罰項之後，就可以減少網路過擬合的概率。

啟用函式

sigmoid 函式

σ(z)=11+exp(−z)

波形圖如下：將輸入 x 對映到 [0-1] 之間

sigmoid 函式的梯度如下：

σ′(z)

DeepLearning (六) 學習筆記整理：神經網路以及卷積神經網路

神經網路

神經網路模型

前向傳播

反向傳播

Neural Networds: Tips and Tricks

Gradient Check

Regularization

啟用函式

sigmoid 函式

DeepLearning (六) 學習筆記整理：神經網路以及卷積神經網路

Tensorflow學習筆記（第三天）—卷積神經網路

tensorflow學習筆記（第一天）-深度卷積神經網路

吳恩達深度學習：基於Matlab完成卷積神經網路第四課第一週程式設計任務

機器學習實驗（四）：用tensorflow實現卷積神經網路識別人類活動

吳恩達Coursera深度學習課程 DeepLearning.ai 提煉筆記（4-2）-- 深度卷積模型

【深度學習理論】一文看懂卷積神經網路

Tensorflow例項：實現簡單的卷積神經網路

MyBatis-Plus學習筆記(1)：環境搭建以及基本的CRUD操作

神經網路6_CNN(卷積神經網路)、RNN(迴圈神經網路)、DNN(深度神經網路)概念區分理解

BP神經網路&卷積神經網路概念

Neural Networks and Convolutional Neural Networks Essential Training 神經網路和卷積神經網路基礎教程 Lynda課程中文字幕

深層神經網路和卷積神經網路的反向傳播過程推導

從神經網路到卷積神經網路的瞭解

Deep learning－全連線層神經網路與卷積神經網路

Batch Normalization--全連線神經網路和卷積神經網路實戰

神經網路及卷積神經網路的訓練——反向傳播演算法

opencv學習筆記（二十）cvFilter2D()卷積以及卷積邊界的處理

機器學習筆記（十四）：TensorFlow實戰六（經典卷積神經網路：AlexNet ）

機器學習筆記（十六）：TensorFlow實戰八（經典卷積神經網路：GoogLeNet）

DeepLearning (六) 學習筆記整理：神經網路以及卷積神經網路

神經網路

神經網路模型

前向傳播

反向傳播

Neural Networds: Tips and Tricks

Gradient Check

Regularization

啟用函式

sigmoid 函式

相關推薦