機器學習第三章
1.線性模型的基本形式(P53)
給定d個屬性描述,預測函式如下形式
一般向量形式
(3.2)
其中,為列向量。w和b學得之後,就可以確定模型。
2.線性迴歸
給定資料集,其中,.已知屬性和結果,學習w和b。
,即使得
這裡我們使用均方誤差的方式去度量回歸任務的效能,因此我們讓均方誤差最小化
(3.4)
求解w和b使(3.4)式最小化的過程,稱為線性迴歸模型的最小二乘“引數估計”。分別對w和b求導,
由上式可得到
(3.5.1)
(3.6.1)
使用(3.5.1)式對w求導得
(3.5)
使用(3.6.1)式對d求導得
(3.6)
令(3.5),(3.6)為0,可得到w和b的最優解。
多元線性迴歸
令w'=(w;b),,則
PS:X矩陣在這裡多加了一個‘1’元素,是為了與b相乘,
類似於(3.4)式,有
矩陣的轉置乘以矩陣本身等於矩陣的平方,
對求導得,將上式轉化為下式
(3.10)
3.對數機率迴歸
對數線性模型,對(3.2)式兩邊取對數得
簡化為以下形式
(3.15)
引入對數機率函式
將對數機率函式帶入(3.15)式,得
(3.18)
(3.18.1)
兩邊取對數,轉化為對數線性迴歸模型,得
概率模型
有(3.18)式轉換可得,
, (3.23)
(3.24)
對數迴歸模型最大化“對數似然”
(3.25)
令,,則可簡寫成.再令,
,則式(3.25)中的似然項可重寫為
(3.26)
當或,即可獲得式(3.23)和(3.24)
(3.23)式用簡寫,
等式兩邊取對數
(3.24)式用簡寫,
等式兩邊取對數
由以上可得,我們將(3.26)帶入(3.25),可得到最小化公式
(3.27)
令或,即可得到以上推導過程,式(3.27)為最小化,(3.25)為最大化,
所以上式加了個負號。
牛頓法求最優解
(3.27)式對求一階導,令,,
(PS:這裡普及一個對數求導公式,,)
由普及公式可知
, (3.30.1)
(3.30)
利用式(3.30)進行求導,可得式(3.27)的二階導,先對式(3.30.1)分別進行求導,先令 為,為
(PS:分式求導公式,已知,令,,則)
由已知公式,得
由以上推導可得二階導為
用牛頓法進行多次迭代後,得到以下公式
可以利用此公式進行多次迴圈,得出w和b
(公式寫得有點多,有出錯的地方,請指正。)