機器學習之梯度下降法數學推導--分類

PS:本文中的log等同於我們國內的ln

sigmoid函式

之前那一文中提到了一般的梯度上升的公式推導，但是在《機器學習實戰》一書中，實現的是分類方法，因此，雖然最終的結果相似，但是其實本質有很大的不同。

一般來講我們把實物分成兩類，因此我們需要將結果對映到兩個結果(是或非)，因為一般的階躍函式在求導之類的問題上會變得相當複雜，因此我們用一個更加圓滑的sigmoid函式來對映，所有輸入到這個函式的實數都會被轉化到0-1之間，它的公式為g(z)=11+e−z

同時它對應的影象如圖所示:
sigmoid

於是我們可以將得到的結果進行四捨五入，分類成0或1

Logistic 迴歸

這裡的意思是，將我們的分類邊界線作模型，進行擬合，並以此來分類。

我們假設經過sigmoid函式處理過的結果為hΘ(x),因為是在0-1之間，因此可以看做是概率，另外，我們可以假設，分類到0或者1的概率。

P(y=1|x;θ)=hθ(x)P(y=0|x;θ)=1−hθ(x)(1)
將以上兩個概率公式整合一下成為一個概率公式，
p(y|x;θ)=(hθ(x))y(1−hθ(x))1−y(2)

梯度上升解決迴歸問題

1. 最大似然估計

這裡我們使用最大似然估計法，這個在大學的高等數學中應該都有學習過，就不在贅述。這裡假設我們有m個訓練集。

L(θ)

=∏i=1mp(y(i)|x(i);θ)=∏i=1m(hθ(x(i)))y(i)(1−hθ(x(i)))1−y(i)(3)
為了求導方便，我們一般會將似然函式L加上log函式，因為log函式是遞增函式，因此不影響似然函式求最值。
這裡會用到一個log函式的性質logab=bloga，推導得：
l(θ)=logL(θ)=∑i=1my(i)logh(x(i))+(1−y(i))log(1−h(x(i)))(4)
將l函式對θ求導
∂∂θjl(θ)=(y1hθ(x)−(1−y)11−hθ(x))∂∂θjhθx(5)

2. sigmoid函式求導

h′(x)=dd

x11+e−x=1(1+e−x)2(e−x)=1(1+e−x)(1−1(1+

機器學習之梯度下降法數學推導--分類

sigmoid函式

Logistic 迴歸

梯度上升解決迴歸問題

1. 最大似然估計

2. sigmoid函式求導

機器學習之梯度下降法數學推導--分類

機器學習之梯度下降法

機器學習--監督學習之梯度下降法

吳恩達機器學習筆記——梯度下降法

機器學習之--梯度下降演算法

【機器學習】梯度下降法詳解

影象與機器學習-1-梯度下降法與ubuntu

機器學習(7)--梯度下降法（GradientDescent）的簡單實現

機器學習之梯度下降演算法Gradient Descent

機器學習中梯度下降法和牛頓法的比較

機器學習之--梯度下降和最小二乘法算線性回歸

機器學習中梯度下降法原理及用其解決線性迴歸問題的C語言實現

機器學習筆記之梯度下降法

梯度下降法基本推導--機器學習最基本的起點

機器學習：梯度下降和牛頓法

機器學習筆記(1)---監督學習之梯度下降

Python機器學習之梯度提升樹

機器學習之——正規方程法

機器學習：梯度下降gradient descent

機器學習筆記——梯度下降（Gradient Descent）

機器學習之梯度下降法數學推導--分類

sigmoid函式

Logistic 迴歸

梯度上升解決迴歸問題

1. 最大似然估計

2. sigmoid函式求導

相關推薦