反向傳播演算法詳解

作者：Great Learning Team

神經網路
什麼是反向傳播？
反向傳播是如何工作的？
損失函式
為什麼我們需要反向傳播？
前饋網路
反向傳播的型別
案例研究

在典型的程式設計中，我們輸入資料，執行處理邏輯並接收輸出。如果輸出資料可以某種方式影響處理邏輯怎麼辦？那就是反向傳播演算法。它對以前的模組產生積極影響，以提高準確性和效率。

讓我們來深入研究一下。

神經網路（Neural network）

神經網路是連線單元的集合。每個連線都有一個與其相關聯的權重。該系統有助於建立基於海量資料集的預測模型。它像人類的神經系統一樣工作，有助於理解影象，像人類一樣學習，合成語音等等。

什麼是反向傳播（What is backpropagation?）

我們可以將反向傳播演算法定義為在已知分類的情況下，為給定的輸入模式訓練某些給定的前饋神經網路的演算法。當示例集的每一段都顯示給網路時，網路將檢視其對示例輸入模式的輸出反應。之後，測量輸出響應與期望輸出與誤差值的比較。之後，我們根據測量的誤差值調整連線權重。

在深入研究反向傳播之前，我們應該知道是誰引入了這個概念以及何時引入。它最早出現在20世紀60年代，30年後由大衛·魯梅爾哈特、傑弗裡·辛頓和羅納德·威廉姆斯在1986年的著名論文中推廣。在這篇論文中，他們談到了各種神經網路。今天，反向傳播做得很好。神經網路訓練是通過反向傳播實現的。通過這種方法，我們根據前一次執行獲得的錯誤率對神經網路的權值進行微調。正確地採用這種方法可以降低錯誤率，提高模型的可靠性。利用反向傳播訓練鏈式法則的神經網路。簡單地說，每次前饋通過網路後，該演算法根據權值和偏差進行後向傳遞，調整模型的引數。典型的監督學習演算法試圖找到一個將輸入資料對映到正確輸出的函式。反向傳播與多層神經網路一起工作，學習輸入到輸出對映的內部表示。

反向傳播是如何工作的？（How does backpropagation work?）

讓我們看看反向傳播是如何工作的。它有四層：輸入層、隱藏層、隱藏層II和最終輸出層。

所以，主要的三層是：

1.輸入層

2.隱藏層

3.輸出層

每一層都有自己的工作方式和響應的方式，這樣我們就可以獲得所需的結果並將這些情況與我們的狀況相關聯。讓我們討論有助於總結此演算法所需的其他細節。

這張圖總結了反向傳播方法的機能。

1.輸入層接收x

2.使用權重w對輸入進行建模

3.每個隱藏層計算輸出，資料在輸出層準備就緒

4.實際輸出和期望輸出之間的差異稱為誤差

5.返回隱藏層並調整權重，以便在以後的執行中減少此錯誤

這個過程一直重複，直到我們得到所需的輸出。訓練階段在監督下完成。一旦模型穩定下來，就可以用於生產。

損失函式（Loss function）

一個或多個變數被對映到實數，這些實數表示與這些變數值相關的某個數值。為了進行反向傳播，損失函式計算網路輸出與其可能輸出之間的差值。

為什麼我們需要反向傳播？（Why do we need backpropagation?）

反向傳播有許多優點，下面列出一些重要的優點：

•反向傳播快速、簡單且易於實現

•沒有要調整的引數

•不需要網路的先驗知識，因此成為一種靈活的方法

•這種方法在大多數情況下都很有效

•模型不需要學習函式的特性

前饋網路（Feed forward network）

前饋網路也稱為MLN，即多層網路。之所以稱為前饋，是因為資料僅在NN（神經網路）中通過輸入節點，隱藏層並最終到達輸出節點。它是最簡單的人工神經網路。

反向傳播的型別（Types of backpropagation）

有兩種型別的反向傳播網路。

•靜態反向傳播（Static backpropagation）

•迴圈反向傳播（Recurrent backpropagation）

靜態反向傳播（Static backpropagation）

在這個網路中，靜態輸入的對映生成靜態輸出。像光學字元識別這樣的靜態分類問題將是一個適合於靜態反向傳播的領域。

迴圈反向傳播（Recurrent backpropagation）

反覆進行反向傳播，直到達到某個閾值為止。在到達閾值之後，將計算誤差並向後傳播。

這兩種方法的區別在於，靜態反向傳播與靜態對映一樣快。

案例研究（Case Study）

讓我們使用反向傳播進行案例研究。為此，我們將使用Iris資料（鳶尾花卉資料集），該資料包含諸如萼片和花瓣的長度和寬度之類的特徵。在這些幫助下，我們需要確定植物的種類。

為此，我們將構建一個多層神經網路，並使用sigmoid函式，因為它是一個分類問題。

讓我們看一下所需的庫和資料。

import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split

為了忽略警告，我們將匯入另一個名為warnings的庫。

import warnings
warnings.simplefilter(action='ignore', category=FutureWarning)

接著讓我們讀取資料。

iris = pd.read_csv("iris.csv")
iris.head()

現在我們將把類標記為0、1和2。

iris. replace (, , inplace=True)

我們現在將定義函式，它將執行以下操作。

1.對輸出執行獨熱編碼（one hot encoding）。

2.執行sigmoid函式

3.標準化特徵

對於獨熱編碼，我們定義以下函式。

def to_one_hot(Y):
    n_col = np.amax(Y) + 1
    binarized = np.zeros((len(Y), n_col))
    for i in range(len(Y)):
        binarized ] = 1.
return binarized

現在我們來定義一個sigmoid函式

def sigmoid_func(x):
    return 1/(1+np.exp(-x))
def sigmoid_derivative(x):
    return sigmoid_func(x)*(1 – sigmoid_func(x))

現在我們將定義一個用於標準化的函式。

def normalize (X, axis=-1, order=2):
    l2 = np. atleast_1d (np.linalg.norm(X, order, axis))
    l2 = 1
return X / np.expand_dims(l2, axis)

現在我們將對特徵進行規範化，並對輸出應用獨熱編碼。

x = pd.DataFrame(iris, columns=columns)
x = normalize(x.as_matrix())

y = pd.DataFrame(iris, columns=columns)
y = y.as_matrix()
y = y.flatten()
y = to_one_hot(y)

現在是時候應用反向傳播了。為此，我們需要定義權重和學習率。讓我們這麼做吧。但在那之前，我們需要把資料分開進行訓練和測試。

#Split data to training and validation data（將資料拆分為訓練和驗證資料）
X_train, X_test, y_train, y_test = train_test_split(x, y, test_size=0.33)
#Weights
w0 = 2*np.random.random((4, 5)) - 1 #for input - 4 inputs, 3 outputs
w1 = 2*np.random.random((5, 3)) - 1 #for layer 1 - 5 inputs, 3 outputs
#learning rate
n = 0.1

我們將為錯誤設定一個列表，並通過視覺化檢視訓練中的更改如何減少錯誤。

errors = []

讓我們執行前饋和反向傳播網路。對於反向傳播，我們將使用梯度下降演算法。

for i in range (100000):
#Feed forward network
layer0 = X_train
layer1 = sigmoid_func(np.dot(layer0, w0))
layer2 = sigmoid_func(np.dot(layer1, w1))
Back propagation using gradient descent
layer2_error = y_train - layer2
layer2_delta = layer2_error * sigmoid_derivative(layer2)
layer1_error = layer2_delta.dot (w1.T)
layer1_delta = layer1_error * sigmoid_derivative(layer1)
w1 += layer1.T.dot(layer2_delta) * n
w0 += layer0.T.dot(layer1_delta) * n
error = np.mean(np.abs(layer2_error))
errors.append(error)

準確率將通過從訓練資料中減去誤差來收集和顯示

accuracy_training = (1 - error) * 100

現在讓我們直觀地看一下如何通過減少誤差來提高準確度。（視覺化）

plt.plot(errors)
plt.xlabel('Training')
plt.ylabel('Error')
plt.show()

現在讓我們檢視一下準確率。

print ("Training Accuracy of the model " + str (round(accuracy_training,2)) + "%")

Output: Training Accuracy of the model 99.04%

我們的訓練模型表現很好。現在讓我們看看驗證的準確性。

#Validate
layer0 = X_test
layer1 = sigmoid_func(np.dot(layer0, w0))
layer2 = sigmoid_func(np.dot(layer1, w1))
layer2_error = y_test - layer2
error = np.mean(np.abs(layer2_error))
accuracy_validation = (1 - error) * 100
print ("Validation Accuracy of the model "+ str(round(accuracy_validation,2)) + "%")

Output: Validation Accuracy 92.86%

這個效能符合預期。

應遵循的最佳實踐準則（Best practices to follow）

下面討論一些獲得好模型的方法：

•如果約束非常少，則系統可能不起作用

•過度訓練，過多的約束會導致過程緩慢

•只關注少數方面會導致偏見

反向傳播的缺點（Disadvantages of backpropagation）

•輸入資料是整體效能的關鍵

•有噪聲的資料會導致不準確的結果

•基於矩陣的方法優於小批量方法（mini-batch）

綜上所述，神經網路是具有輸入和輸出機制的連線單元的集合，每個連線都有相關聯的權值。反向傳播是"誤差的反向傳播"，對訓練神經網路很有用。它快速、易於實現且簡單。反向傳播對於處理語音或影象識別等易出錯專案的深度神經網路非常有益。

反向傳播演算法詳解

神經網路（Neural network）

什麼是反向傳播（What is backpropagation?）

反向傳播是如何工作的？（How does backpropagation work?）

損失函式（Loss function）

前饋網路（Feed forward network）

反向傳播的型別（Types of backpropagation）

案例研究（Case Study）

乾貨 | 深度學習之CNN反向傳播演算法詳解

反向傳播演算法詳解

乾貨 | 深度學習之卷積神經網路（CNN）的前向傳播演算法詳解

深度學習 --- BP演算法詳解（誤差反向傳播演算法）

反向傳播(Backpropagation)演算法詳解

神經網路及反向傳播(bp)演算法詳解

詳解反向傳播演算法(上)

nginx反向代理配置詳解

php openssl_sign() 語法+RSA公私鑰加密解密,非對稱加密演算法詳解

Show, attend and tell演算法詳解及原始碼

資料分析學習之不得不知的八大演算法詳解

吳恩達機器學習（第十章）---神經網路的反向傳播演算法

程式設計思想 - 五大常用演算法詳解

吳恩達機器學習 - 神經網路的反向傳播演算法吳恩達機器學習 - 神經網路的反向傳播演算法

BP反向傳播演算法

Kadane演算法詳解及求解最大子數列和問題

K-NN近鄰演算法詳解

字典序演算法詳解

【演算法詳解】二維動態規劃

圖的最小生成樹prim演算法詳解

反向傳播演算法詳解

神經網路（Neural network）

什麼是反向傳播（What is backpropagation?）

反向傳播是如何工作的？（How does backpropagation work?）

損失函式（Loss function）

前饋網路（Feed forward network）

反向傳播的型別（Types of backpropagation）

案例研究（Case Study）

相關推薦