1. 程式人生 > >梯度下降 隨機梯度下降 批量梯度下降

梯度下降 隨機梯度下降 批量梯度下降

函數 算法 學習 梯度 target 最快 每次 深度學習 sun

梯度下降(GD)

梯度的本意是一個向量,表示某一函數在該點處的方向導數沿著該方向取得最大值,導數對應的是變化率

即函數在該點處沿著該方向變化最快,變化率最大(為該梯度的模)

隨機梯度下降(SGD):每次叠代隨機使用一組樣本

針對BGD算法訓練速度過慢的缺點,提出了SGD算法,普通的BGD算法是每次叠代把所有樣本都過一遍,每訓練一組樣本就把梯度更新一次。而SGD算法是從樣本中隨機抽出一組,訓練後按梯度更新一次,然後再抽取一組,再更新一次,在樣本量及其大的情況下,可能不用訓練完所有的樣本就可以獲得一個損失值在可接受範圍之內的模型了。

批量隨即下降(BGD):每次叠代使用所有樣本

在深度學習中 數據量非常大時,使用所有樣本耗費時將會很長

資料1

梯度下降 隨機梯度下降 批量梯度下降