1. 程式人生 > >為什麼負梯度方向是函式下降最快的方向

為什麼負梯度方向是函式下降最快的方向

推導

f(x)f (\vec {x})是target function,x0\vec {x}_0是start point。 在x0\vec {x}_0處做寫出一階泰勒展式: f(x)=f(x0)+f(x0)(xx0)+O(xx02)f (\vec {x})=f (\vec {x}_0)+\nabla f (\vec {x}_0) \cdot (\vec {x}-\vec {x}_0)+O (\lVert \vec {x}-\vec {x}_0 \rVert^2) xx02\lVert \vec {x}-\vec {x}_0 \rVert^2

足夠小時,有f(x0)f(x)=f(x0)(xx0)f (\vec {x}_0)-f (\vec {x})=-\nabla f (\vec {x}_0) \cdot (\vec {x}-\vec {x}_0) 等式右邊是f(x0)-\nabla f (\vec {x}_0)(xx0)(\vec {x}-\vec {x}_0)的內積,我們知道當這兩個向量同向時,內積最大,此時函式值下降的最多,於是可以得出結論:負梯度方向是函式下降最快的方向。