5. 神經網路

5.1 前向傳播

神經網路分為很多層，包括輸入層、輸出層和中間的隱層。

使用的符號如下：

$a_i^{(j)}$ 第j層，第i個單元的輸出（activity）

$\Theta^{(j)}$ 第j層向第j+1層傳播的係數矩陣，如果在j層有 $S_{j}$

j $S_j$ 個節點，j+1層有

S_{j + 1}

$S_{j+1}$ 個節點，那麼，

Θ^{(j)} \in R^{S_{j + 1} \times (S_{j} + 1)}

$\Theta^{(j)} \in R^{S_{j+1}\times (S_j+1)}$ ,其中的+1 是由於上述節點沒有包含偏倚節點（bias）即邏輯迴歸中的常數項b。

通過調節權重係數，神經網路可以得到XOR, XNOR, AND, NOT, OR

多分類問題

神經網路處理多分類問題採用的是one-vs-all的方法，對於k類問題，輸出層為k個節點，正確的分類輸出節點為1，其餘的為0.

5.2 損失函式

神經網路中節點的輸入到輸出的非線性函式一般選用sigmoid函式，因此藉助邏輯迴歸的損失函式，可以寫出輸出層有K個節點有k個樣本的神經網路的損失函式

\begin{aligned} J (Θ) & = - \frac{1}{m} \sum_{i = 1}^{m} \sum_{k = 1}^{K} [y_{k}^{(i)} l o g (h_{Θ} (x^{(i)})_{k}) + (1 - y_{k}^{(i)}) l o g (1 - h_{Θ} (x^{(i)})_{k}] \\ + \frac{λ}{2 m} \sum_{l = 1}^{L - 1} \sum_{i = 1}^{S_{l}} \sum_{j = 1}^{S_{l + 1}} (Θ_{j, i}^{(l)})^{2} \end{aligned}

$\begin{aligned} J(\Theta) &= -\dfrac{1}{m}\sum_{i=1}^m\sum_{k=1}^K[y_k^{(i)}log(h_\Theta(x^{(i)})_k)+(1-y_k^{(i)})log(1-h_\Theta(x^{(i)})_k]\\ &+\dfrac{\lambda}{2m}\sum_{l=1}^{L-1}\sum_{i=1}^{S_l}\sum_{j=1}^{S_{l+1}}(\Theta_{j,i}^{(l)})^2 \end{aligned}$
上式中，

L ​

$L$ 為神經網路的總層數，每一層的節點數為

S_{l} ​

$S_l$ ,

$\Theta_{j,i}^{(l)}$ 表示第 $l$ 層的第j 個節點到第 $l+1$ 層的第i 個節點的連結的權重。

上面的損失函式就是將每個輸出節點的損失函式加和同時考慮所有權重的正則化。需要注意的是，第一個2重求和中的i為遍歷樣本，k為遍歷輸出層節點，第二個3重求和中的i，j都是指節點，不是樣本。

5.3 BP演算法

為了優化損失函式，需求計算 $J(\Theta), \dfrac{\partial J(\Theta)}{\partial \Theta}$ ，這裡採用向後傳播（BP）演算法，推導過程如下：

觀察損失函式，先忽略正則化項，第一項等於所有輸出節點的損失函式加和，我們首先對其中一個損失函式求導，首先，令函式
$C=-\sum_{k=1}^Ky_k^{(i)}log(h_\Theta(x^{(i)})_k)-(1-y_k^{(i)})log(1-h_\Theta(x^{(i)})_k$

由於需要對每一層之間的各個權重係數進行求導，這裡我們先從輸出層開始，利用求導鏈式法則，可以得到：

\begin{matrix} (5-1) & \frac{\partial C}{\partial Θ_{j i}^{(L - 1)}} = \frac{\partial C}{\partial z_{j}^{(L)}} \cdot \frac{\partial z_{j}^{(L)}}{\partial Θ_{j i}^{(L - 1)}} \end{matrix}

神經網路和BP演算法

5. 神經網路

5.1 前向傳播

多分類問題

5.2 損失函式

5.3 BP演算法

神經網路和BP演算法推導

神經網路和BP演算法

前向神經網路和 BP 演算法詳解 --- 之 DNN

西瓜書5.5 程式設計實現BP神經網路——標準BP演算法、累積BP演算法

機器學習——神經網路累積BP演算法

神經網路之BP演算法

神經網路與BP演算法推導

多層前饋神經網路及BP演算法

神經網路中BP演算法的原理與用Python實現原始碼

卷積神經網路反向BP演算法公式推導

前饋神經網路，BP演算法

機器學習總結（七）：基本神經網路、BP演算法、常用啟用函式對比

從 0 開始機器學習 - 神經網路反向 BP 演算法！

Python實現神經網路Part 1: 實現forward和BP演算法的神經元

（轉載）深度學習基礎（3）——神經網路和反向傳播演算法

BP神經網路反向傳播演算法一步一步例項推導（Backpropagation Example）

Matlab實現BP神經網路和RBF神經網路（一）

Andrew Ng機器學習筆記+Weka相關演算法實現（三）神經網路和引數含義

【演算法】神經網路和深度學習簡介

Matlab實現BP神經網路和RBF神經網路（二）

神經網路和BP演算法

5. 神經網路

5.1 前向傳播

多分類問題

5.2 損失函式

5.3 BP演算法

相關推薦