1. 程式人生 > >機器學習,最優化數值計算常用演算法

機器學習,最優化數值計算常用演算法

一 機器學習表示及數值求解原理

大部分機器學習,尤其是神經網路、深度網路,最優化一個經驗損失函式(通常帶有正則項),損失函式在某個樣本點可表示為:L(β,X(i)),在訓練樣本上的期望損失函式表示為L(β)=1ni=0nL(β,X(i))訓練就是給定在樣本上尋找期望損失函式L(β)全域性最小值所在的引數β即:

β=argminβΘL(β))
通用的損失函式最優化的數值方法,來源於泰勒展開式,多元函式的泰勒展開式可表示為:
L(β+tα)=L(β)+i=1n(j=1p(tαjβj)iL(β))+o(tn)α2=1

1.1 一階逼近

一階泰勒展開式為:

L(β+tα)=L(β)+tL(β)α+o(t)α2=1

給定β,α2=1,t>0的條件下,忽略高階項,在α

=sL(β)s=L(β)1時,有最小值。