後向傳播算法“backpropragation”詳解

阿新 • • 發佈：2017-07-24

關聯常常 ges 傳播鏈式包括 alt img 技術

為什麽要使用backpropagation?

技術分享

梯度下降不用多說，如果不清楚的可以參考http://www.cnblogs.com/yangmang/p/6279054.html。

神經網絡的參數集合theta，包括超級多組weight和bais。

要使用梯度下降，就需要計算每一個參數的梯度，但是神經網絡常常有數以萬計，甚至百萬的參數，所以需要使用backpropagation來高效地計算梯度。

backpropagation的推導

backpropagation背後的原理其實很簡單，就是求導的鏈式法則。

技術分享

我們從上面的公式開始推導。以其中一個神經元為例。

技術分享

如上面的紅框中所示，根據鏈式法則，l對w的偏導數，等於z對w的偏導數乘以l對z的偏導數。

l對w的梯度可以分為兩部分：

前向傳播：對所有參數求梯度；

後向傳播：對所有激活函數的輸入z求梯度；

技術分享

前向傳播的梯度求法簡單，就z對w求偏導數，直接求出就是對應的輸入x_i。

技術分享

後向傳播比較復雜，需要再使用鏈式法則，如紅框中所示。l/z的梯度分解為a/z和l/a的梯度。

a對z的導數圖像如上所示，現在關鍵就是求l對a的偏導數。

技術分享

為了求出l對a的偏導數，繼續使用鏈式法則，關聯上後面的兩個神經元。

現在問題就轉化成了，求紅框中的兩個問號的梯度/

技術分享

現在假設兩個問號梯度已知，就可以求出之前l對z的梯度了。

技術分享

現在來看看怎麽可以求出l對z的梯度。

技術分享

第一種情況：當z‘和z’‘為輸出層時。根據鏈式法則，y/z和l/y的梯度都是可解的，這樣問題就解決了。

技術分享

第二種情況：不是輸出層。就是說還有後續的神經元幾點連接。

技術分享

循環計算l對z的梯度，直到輸出層，出現case1的情況，問題也就解決了。

技術分享

所以，我們就可以從輸出層開始，反向計算l對每層z的梯度，在結合前向傳播得到的梯度，就可以計算出梯度下降所需的梯度了。

而且，反向傳播的復雜度和前向傳播是一樣的，這樣就大大提升了梯度計算的效率。

最後結果就是這樣的：

技術分享

後向傳播算法“backpropragation”詳解

關聯常常 ges 傳播鏈式包括 alt img 技術為什麽要使用backpropagation? 梯度下降不用多說，如果不清楚的可以參考http://www.cnblogs.com/yangmang/p/6279054.html。神經網絡的參數集合theta，包

Isolation Forest算法實現詳解

左右 clas 1.2 att bre 二叉最大值和最小值二叉樹代碼實現本文介紹的 Isolation Forest 算法原理請參看我的博客：Isolation Forest異常檢測算法原理詳解，本文中我們只介紹詳細的代碼實現過程。 1、ITree的設計與實現首先

LCA離線算法Tarjan詳解

lca class 初始化連通一個 ans 為什麽原理子節點離線算法也就是需要先把所有查詢給保存下來，最後一次輸出結果。離線算法是基於並查集實現的，首先就是初始化P[i] = i。接下來對於每個點進行dfs： ①首先判斷是否有與該點有關的查詢，如果當前該

【轉載】前向傳播算法(Forward propagation)與反向傳播算法(Back propagation)

應用思想 size 之路基礎 pro 中間 nbsp sdn 原文鏈接：https://blog.csdn.net/bitcarmanlee/article/details/78819025 雖然學深度學習有一段時間了，但是對於一些算法的具體實現還是模糊不清，用了很久也

LeetCode算法題詳解之兩個數組的交集

for mage != 有助於 class 學習 ret arr hash 題目背景: 這個與我們高中時期學習的交集是一樣的，順便復習一下相關的數學知識有助於更好的理解。交集的定義: 對於兩個集合A和B，定義A和B的交集為C，其中C={x|x屬於A且X屬於B}，

前向傳播算法

兩層之間分享 inf 表示方式特征 play .com 一個神經元有多個輸入和一個輸出，每個神經元的輸入既可以是其他神經元的輸出也可以是整個神經網絡的輸入。所謂神經網絡的結構就是指的是不同的神經元之間的連接結構。如下圖所示，一個最簡單的神經元結構的輸出就是所有輸入的

吳裕雄 python 神經網絡——TensorFlow 三層簡單神經網絡的前向傳播算法

tdd global dom NPU sta seed flow python dde import tensorflow as tf w1= tf.Variable(tf.random_normal([2, 3], stddev=1, seed=1)) w2=

【神經網絡和深度學習】筆記 - 第二章反向傳播算法

討論固定特征 array sed 並不會思想隨機梯度相關上一章中我們遺留了一個問題，就是在神經網絡的學習過程中，在更新參數的時候，如何去計算損失函數關於參數的梯度。這一章，我們將會學到一種快速的計算梯度的算法：反向傳播算法。這一章相較於後面的章節涉及到的數學

算法學習（一）五個常用算法概念了解

man 意義利用 program target 路徑滿足世紀數學網傳常用五大算法：貪婪算法，動態規劃算法，分治算法，回溯算法以及分支限界算法貪心算法貪心算法（又稱貪婪算法）是指，在對問題求解時，總是做出在當前看來是最好的選擇。也就是說，不從整體最優上加以考

反向傳播算法（過程及公式推導）

不能簡化會有 geo 之前代碼求和不同 eof 一、反向傳播的由來在我們開始DL的研究之前，需要把ANN—人工神經元網絡以及bp算法做一個簡單解釋。關於ANN的結構，我不再多說，網上有大量的學習資料，主要就是搞清一些名詞：輸入層/輸入神經元，輸出層/輸出神經元，

後綴數組代碼詳解

技術決定 getheight break 所在離散兩個 tps wid 說起來學了很久的後綴數組了思想還是很容易明白的最大的問題就是代碼看不懂然後在不斷模擬研究的過程中終於弄清楚了一點就決定寫下來了不然又會忘的QAQ 以下是代碼 ps：首先要弄懂基數排

反向傳播算法

根據反向 alt 輸出 str 調整步驟 bsp tro 後向傳播指的是在訓練的時候，根據最終輸出的誤差來調整倒數第二層、倒數第三層……第一層的參數的過程。輸出層權值調整：隱藏層權值調整：偏置的調整：後向傳播算法步驟反向傳播算法

opencv利用hough概率變換擬合得到直線後,利用DDA算法得到直線上的像素點坐標

步驟 else 每次 xunit pre 差值一點假設 color 　　圖片霍夫變換擬合得到直線後,怎樣獲得直線上的像素點坐標? 　　這是我今天在圖像處理學習中遇到的問題,霍夫變換采用的概率霍夫變換,所以擬合得到的直線信息其實是直線的兩個端點的坐標,這樣一個比較直接的思

七大經典排序算法，了解一下？

根節點排序一次次數 ble 算法 amp 開始 title 常見排序算法總結與實現本文使用Java實現這幾種排序。以下是對排序算法總體的介紹。冒泡排序比較相鄰的元素。如果第一個比第二個大，就交換他們兩個。對每一對相鄰元素作同樣的工作，從開始第一對到結尾的

尾插法建表後遞歸算法刪除表中元素

truct 遞歸繼續 div tlist 發現屏蔽因此輸入 1 #include<stdio.h> 2 #include<stdlib.h> 3 typedef struct LNode{ 4 int data; 5

機器學習-反向傳播算法（BP）代碼實現（matlab）

sha eric his work onclick chan same images let %% Machine Learning Online Class - Exercise 4 Neural Network Learning % Instructions

卷積神經網路CNN的前向和後向傳播（一）

卷積神經網路CNN的前向和後向傳播卷積運算與相關的區別卷積運算的正向和反向傳播原文 Forward And Backpropagation in Convolutional Neural Network地址： https://medium.

卷積神經網路CNN的前向和後向傳播（二）

卷積神經網路CNN的前向和後向傳播（二） padding=1，stride=1的情形輸入為8x8和卷積核3x3 對輸入的求導對卷積核的求導本文在卷積神經網路CNN的前向和後向傳播（一）的基礎上做一些擴充套件

web後端mysql查詢java程式碼詳解

核心程式碼如下所示： Class.forName("com.mysql.jdbc.Driver"); &

八皇後問題（遞歸方法詳解）

span isp als using ostream 開始 int 對角線沒有八皇後遞歸詳解核心代碼如下： //八皇後遞歸解法 #include<iostream> using namespace std; int queen[9] = {-1,-1

後向傳播算法“backpropragation”詳解

為什麽要使用backpropagation?

backpropagation的推導

相關推薦