1. 程式人生 > >【ML模型詳細推導1】- 線性迴歸

【ML模型詳細推導1】- 線性迴歸

線性迴歸


學習過程主要順著 周志華《機器學習》第三章線性模型 內容,本次線性迴歸模型總結按照 “模型 + 策略 + 演算法 ” 的統計學習三要素整理。


0. 資料集和目標

訓練集假設m個樣本,每個樣本n個特徵/屬性,每個樣本包含一個標記y。
表示為:
D

= [ X 1 (
1 )
X 2
( 1 )
. . . X n ( 1 ) y 1
X 1 ( 2 ) X 2 ( 2 ) . . . X n ( 2 ) y 2 . . . . . . . . . . . . . . . X 1 ( m ) X 2 ( m ) . . . X n ( m ) y m
]
D=\begin{bmatrix} X^{(1)}_1& X^{(1)}_2& ...& X^{(1)}_n& y_1& \\ X^{(2)}_1& X^{(2)}_2& ...& X^{(2)}_n& y_2& \\ ...& ...& ...& ...& ...& \\ X^{(m)}_1& X^{(m)}_2& ...& X^{(m)}_n& y_m& \\ \end{bmatrix} 其中, X j ( i ) X^{(i)}_j 代表第 i 個樣本的第 j 個特徵

模型的目標為:對於一個新的樣本,給定特徵 ( X 1 ( k ) , X 2 ( k ) , . . . , X n ( k ) ) (X^{(k)}_1, X^{(k)}_2, ... , X^{(k)}_n) ,可以給出它對應的 y k y_k (在迴歸模型中, y k y_k 是一個連續值)。

1. 模型

針對每個樣本:
f ( x ) = w 1 x 1 + w 2 x 2 + . . . + w n x n + b f(x) = w_1x_1+ w_2x_2+ ...+ w_nx_n +b 其中, w i , b w_i,b 為模型引數, x i x_i 為每個樣本的特徵值。

線性模型試圖學得一個通過特徵的線性組合來進行預測的函式

為了方面操作,簡化為矩陣形式:
f ( X ) = X θ f(X) = X \theta 其中
X = [ X 1 ( 1 ) X 2 ( 1 ) . . . X n ( 1 ) 1 X 1 ( 2 ) X 2 ( 2 ) . . . X n ( 2 ) 1 . . . . . . . . . . . . . . . X 1 ( m ) X 2 ( m ) . . . X n ( m ) 1 ] m ( n + 1 ) ,   θ = [ w 1 w 2 . . . w n b ] ( n + 1 ) 1 X=\begin{bmatrix} X^{(1)}_1& X^{(1)}_2& ...& X^{(1)}_n& 1& \\ X^{(2)}_1& X^{(2)}_2& ...& X^{(2)}_n& 1& \\ ...& ...& ...& ...& ...& \\ X^{(m)}_1& X^{(m)}_2& ...& X^{(m)}_n& 1& \\ \end{bmatrix}_{維度m*(n+1)} , \, \theta=\begin{bmatrix} w_1 \\ w_2 \\ ... \\ w_n \\ b \end{bmatrix}_{維度(n+1)*1}