梯度下降法的三種形式BGD（批量梯度下降）、SGD（隨機梯度下降）以及MBGD（小批量梯度下降）

阿新 • • 發佈：2018-12-20

在應用機器學習演算法時，我們通常採用梯度下降法來對採用的演算法進行訓練。其實，常用的梯度下降法還具體包含有三種不同的形式，它們也各自有著不同的優缺點。

　　下面我們以線性迴歸演算法來對三種梯度下降法進行比較。

　　一般線性迴歸函式的假設函式為：

對應的能量函式（損失函式）形式為：

　　下圖為一個二維引數（θ0θ0和θ1θ1）組對應能量函式的視覺化圖：

1.批量梯度下降（BGD）

　　批量梯度下降法（Batch Gradient Descent，簡稱BGD）是梯度下降法最原始的形式，它的具體思路是在更新每一引數時都使用所有的樣本來進行更新，其數學形式如下：

　　(1) 對上述的能量函式求偏導：

　　(2) 由於是最小化風險函式，所以按照每個引數θθ的梯度負方向來更新每個θθ：

　　具體的虛擬碼形式為：

　　從上面公式可以注意到，它得到的是一個全域性最優解，但是每迭代一步，都要用到訓練集所有的資料，如果樣本數目mm很大，那麼可想而知這種方法的迭代速度！所以，這就引入了另外一種方法，隨機梯度下降。

　　優點：全域性最優解；易於並行實現；

　　缺點：當樣本數目很多時，訓練過程會很慢。

　　從迭代的次數上來看，BGD迭代的次數相對較少。其迭代的收斂曲線示意圖可以表示如下：

2.隨機梯度下降(SGD)

　　由於批量梯度下降法在更新每一個引數時，都需要所有的訓練樣本，所以訓練過程會隨著樣本數量的加大而變得異常的緩慢。隨機梯度下降法（Stochastic Gradient Descent，簡稱SGD）正是為了解決批量梯度下降法這一弊端而提出的。

　　將上面的能量函式寫為如下形式：

　　利用每個樣本的損失函式對θ求偏導得到對應的梯度，來更新θ：

　　具體的虛擬碼形式為：

隨機梯度下降是通過每個樣本來迭代更新一次，如果樣本量很大的情況（例如幾十萬），那麼可能只用其中幾萬條或者幾千條的樣本，就已經將theta迭代到最優解了，對比上面的批量梯度下降，迭代一次需要用到十幾萬訓練樣本，一次迭代不可能最優，如果迭代10次的話就需要遍歷訓練樣本10次。但是，SGD伴隨的一個問題是噪音較BGD要多，使得SGD並不是每次迭代都向著整體最優化方向。

　　優點：訓練速度快；

　　缺點：準確度下降，並不是全域性最優；不易於並行實現。

　　從迭代的次數上來看，SGD迭代的次數較多，在解空間的搜尋過程看起來很盲目。其迭代的收斂曲線示意圖可以表示如下：

3. 小批量梯度下降法MBGD

　　有上述的兩種梯度下降法可以看出，其各自均有優缺點，那麼能不能在兩種方法的效能之間取得一個折衷呢？即，演算法的訓練過程比較快，而且也要保證最終引數訓練的準確率，而這正是小批量梯度下降法（Mini-batch Gradient Descent，簡稱MBGD）的初衷。

　　MBGD在每次更新引數時使用b個樣本（b一般為10），其具體的虛擬碼形式為：

4. 總結

　　Batch gradient descent: Use all examples in each iteration；

　　Stochastic gradient descent: Use 1 example in each iteration；

　　Mini-batch gradient descent: Use b examples in each iteration.

梯度下降法的三種形式BGD（批量梯度下降）、SGD（隨機梯度下降）以及MBGD（小批量梯度下降）

1.批量梯度下降（BGD）

2.隨機梯度下降(SGD)

3. 小批量梯度下降法MBGD

4. 總結

梯度下降法的三種形式BGD（批量梯度下降）、SGD（隨機梯度下降）以及MBGD（小批量梯度下降）

解梯度下降法的三種形式BGD、SGD以及MBGD

梯度下降法的三種形式-BGD、SGD、MBGD

[Machine Learning] 梯度下降法的三種形式BGD、SGD以及MBGD

梯度下降的三種形式

【機器學習】【線性迴歸】梯度下降的三種方式(BGD+SGD+MSGD)以及三種調優方法(加快收斂速度)

梯度下降法的三種形式批量梯度下降法、隨機梯度下降以及小批量梯度下降法

實現梯度下降的三種方式

迴歸模型中殘差的三種形式（轉）

C語言之陣列（陣列賦值的三種形式）

C++ 模板學習總結（三）模板引數的三種形式

VMware12 虛擬機器的網路連線三種形式（橋接模式、NAT模式、主機模式）

go語言for的三種形式

new和delete的三種形式詳解

日常學習隨筆-數組、單鏈表、雙鏈表三種形式實現棧結構的基本操作

詳解ssh通過公鑰密碼、免密碼登錄以及導入公鑰文件三種形式實現遠程登錄

1. 變數提升 2. 條件語句 3. 迴圈語句彈出框的三種形式 If條件的種類

Python - 函式基礎概念 - 三種形式、引數、巢狀、名稱空間

脈衝的三種形式

Java基礎多執行緒之執行緒安全-同步鎖三種形式

梯度下降法的三種形式BGD（批量梯度下降）、SGD（隨機梯度下降）以及MBGD（小批量梯度下降）

1.批量梯度下降（BGD）

2.隨機梯度下降(SGD)

3. 小批量梯度下降法MBGD

4. 總結

相關推薦