1.2.7&1.2.8 【Deep Learning翻譯系列】Derivatives with a Computation Graph 採用計算圖計算微分

阿新 • • 發佈：2018-12-30

我說神經網路的計算是按正向傳遞或前向傳播步驟組織的，我們計算神經網路的輸出，然後是反向傳遞或反向傳播步驟，我們用於計算梯度或計算導數。計算圖解釋了為什麼它以這種方式組織。我們將通過一個例子說明計算圖（比對數概率迴歸或完整的神經網路更簡單的例子）。

假設我們正在嘗試計算一個函式 $J = 3 (a + b c)$

+ b c ) $J=3(a+bc)$ ，我們令

u = b c

$u=bc$ ，

v = a + u

$v=a+u$ ，

J = 3 v

$J=3v$ ，並在計算圖中繪製它們如下。
這裡寫圖片描述

當有一些特殊的輸出變數（例如在這種情況下為

J

$J$ ）你想要優化時，計算圖就派上用場了。在對數概率迴歸的情況下，

J

$J$ 當然是我們試圖最小化的成本函式。我們在這個小例子中看到的是，通過從左到右的傳遞，你可以計算出

J

$J$ 的值。

如果我們將 $v$ 的數值稍微改變一下， $J$ 的值會如何變化？在這裡，我們將 $v$ 增加了0.001。最終的結果是 $J$ 增加了0.003。所以 $\frac{\partial J}{\partial v}=3$ 。因為 $J$ 的增加是 $v$ 的增加的3倍。

現在讓我們看另一個例子。 $\frac{\partial J}{\partial a}=?$ ，換句話說，如果我們改變a的值，那麼這對J的值有何影響？

在程式碼中，當你在你編寫的程式碼中計算這個東西時，我們只是使用變數名dvar來表示 $\frac{\partial J}{\partial var}$ 。

從這個例子來看，利用計算圖計算導數的關鍵點是，當計算微分時，最有效的方法是按照反向進行從右到左的計算。特別是，我們首先計算 $\frac{\partial J}{\partial v}$ 。然後，這對於計算關於 $\frac{\partial J}{\partial a}$ 和 $\frac{\partial J}{\partial u}$ 是有用的。再往下傳播，這些對於計算關於 $\frac{\partial J}{\partial b}$ 和 $\frac{\partial J}{\partial c}$ 也是有用的。

1.2.7&1.2.8 【Deep Learning翻譯系列】Derivatives with a Computation Graph 採用計算圖計算微分

1.2.7&1.2.8 【Deep Learning翻譯系列】Derivatives with a Computation Graph 採用計算圖計算微分

1.2.9&1.2.10 【Deep Learning翻譯系列】Logistic Regression Gradient Descent 對數機率迴歸的梯度下降

1.3.2【Deep Learning翻譯系列】Activation Functions 啟用函式

1.2.11 【Deep Learning翻譯系列】Explanation of Logistic Regression Cost Function 對數機率迴歸代價函式的說明

1.3.1 【Deep Learning翻譯系列】Neural Network Overview神經網路概覽

【GAN ZOO翻譯系列】基於能量的生成對抗網路 Energy-Based Generative Adversarial Networks

【GAN ZOO翻譯系列】InfoGAN： Interpretable Representation Learning by Information Maximizing GAN

【GAN ZOO翻譯系列】s2GAN：使用樣式和結構對抗式網路的生成影象建模

【GAN ZOO翻譯系列】Cat GAN：UNSUPERVISED AND SEMI-SUPERVISED LEARNING WITH CATEGORICAL GAN 用於監督和半監督學習的GAN

【Deep Learning讀書筆記】深度學習中的概率論

【轉】shell命令中>/dev/null 2>&1的實現原理

JDK1.7&1.8源碼對比分析【集合】HashMap

JDK1.7&1.8源碼對比分析【集合】ConcurrentHashMap

PHP 5.6.40, 7.1.26, 7.3.1 & 7.2.14 釋出，安全修復版本

Shell重定向＆>file、2>&1、1>&2的區別

Shell中的>/dev/null 2>&1 與 2>&1 >/dev/null 與&>/dev/null 的區別

[轉載]>/dev/null 2>&1 含義

linux之2>&1

Shell的>/dev/null、2>&1、2>1

2>&1 的用法說明

1.2.7&1.2.8 【Deep Learning翻譯系列】Derivatives with a Computation Graph 採用計算圖計算微分

相關推薦