1.2.9&1.2.10 【Deep Learning翻譯系列】Logistic Regression Gradient Descent 對數機率迴歸的梯度下降

阿新 • • 發佈：2018-12-30

我們按如下方式設定了對數機率迴歸，
$z=w^Tx+b,$
$a = \hat{y} = σ ($

z)," role="presentation">

a = \hat{y} = σ (z),

$a = \hat y=\sigma(z),$

L (a, y) = - (1 - y) \log (1 - \hat{y}) - y \log (\hat{y}) .

$L(a,y)=-(1-y)\log(1-\hat y)-y\log(\hat y).$

在對數機率迴歸中，我們想要做的是修改引數w和b，以減少L。我們已經描述了在單個訓練示例中實際計算損失的四個傳播步驟，現在讓我們談談如何反向計算導數。
對數機率迴歸的計算圖
因為我們想做的是關於這種損失的計算導數，我們反向計算時要做的第一件事就是計算 $\frac {\partial L} {\partial a} =\frac y a + \frac {1-y} {1-a}$ 。

然後 $\frac {\partial L} {\partial z} =\frac {\partial L} {\partial a} \frac {\partial a} {\partial z}=a(1-a)(\frac y a + \frac {1-y} {1-a})=a-y$ 。

最後計算關於w和b的微分
$\frac {\partial L} {\partial w_1} =x_1\frac {\partial L} {\partial z},$
$\frac {\partial L} {\partial w_2} =x_2\frac {\partial L} {\partial z},$
$\frac {\partial L} {\partial b} =\frac {\partial L} {\partial z}.$

因此對數機率迴歸梯度下降計算的方向是：
$w_1:=w_1-\alpha\frac {\partial L} {\partial w_1},$
$w_2:=w_2-\alpha\frac {\partial L} {\partial w_2},$
$b:=b-\alpha\frac {\partial L} {\partial b}.$

其中 $\alpha$ 是學習率。

上面是隻有一個訓練樣本時的對數機率迴歸的梯度下降方向，
現在我們想要為m個訓練樣本的對數機率迴歸進行梯度下降操作。
整體的成本函式 $J=\frac {1} {m} \sum_{i=1}^m L(a^{(i)},y^{(i)})，$
然後 $\frac {\partial J} {\partial w_i} = \frac 1 m \sum \frac {\partial L(a^{(i)},y^{(i)})} {\partial w_i}。$
令 $\alpha$ 是學習率，然後梯度下降每次迭代的更新公式為：
$w_1:=w_1-\alpha\frac {\partial J} {\partial w_1},$

1.2.9&1.2.10 【Deep Learning翻譯系列】Logistic Regression Gradient Descent 對數機率迴歸的梯度下降

1.2.9&1.2.10 【Deep Learning翻譯系列】Logistic Regression Gradient Descent 對數機率迴歸的梯度下降

1.2.7&1.2.8 【Deep Learning翻譯系列】Derivatives with a Computation Graph 採用計算圖計算微分

1.3.2【Deep Learning翻譯系列】Activation Functions 啟用函式

1.2.11 【Deep Learning翻譯系列】Explanation of Logistic Regression Cost Function 對數機率迴歸代價函式的說明

1.3.1 【Deep Learning翻譯系列】Neural Network Overview神經網路概覽

【GAN ZOO翻譯系列】基於能量的生成對抗網路 Energy-Based Generative Adversarial Networks

【GAN ZOO翻譯系列】InfoGAN： Interpretable Representation Learning by Information Maximizing GAN

【GAN ZOO翻譯系列】s2GAN：使用樣式和結構對抗式網路的生成影象建模

【GAN ZOO翻譯系列】Cat GAN：UNSUPERVISED AND SEMI-SUPERVISED LEARNING WITH CATEGORICAL GAN 用於監督和半監督學習的GAN

【Deep Learning讀書筆記】深度學習中的概率論

【轉】shell命令中>/dev/null 2>&1的實現原理

ArcGIS for Android 10.2.9（1）：開發環境配置

Shell重定向＆>file、2>&1、1>&2的區別

Shell中的>/dev/null 2>&1 與 2>&1 >/dev/null 與&>/dev/null 的區別

[轉載]>/dev/null 2>&1 含義

linux之2>&1

Shell的>/dev/null、2>&1、2>1

2>&1 的用法說明

linux shell 中的 2>&1 用法說明

hell 1>&2 2>&1 &>filename重定向的含義和區別

1.2.9&1.2.10 【Deep Learning翻譯系列】Logistic Regression Gradient Descent 對數機率迴歸的梯度下降

相關推薦