1. 程式人生 > >線性迴歸-4-欠擬合、過擬合與區域性加權線性迴歸

線性迴歸-4-欠擬合、過擬合與區域性加權線性迴歸

欠擬合、過擬合

線上性迴歸問題中,我們可以通過改變θx看下面的圖:
這裡寫圖片描述
左邊的曲線是在假設y=θ0+θ1x時的擬合結果,但顯然中間的曲線要比左邊的擬合效果更好。我們稱左邊的情況為欠擬合(underfitting)。
這樣看來右邊的不是比左邊更好嗎?!。。。NO!我們稱右邊的情況為過擬合(overfitting)!因為它已經不能反應出樣本的整體分佈情況!

區域性加權線性迴歸(LWR)

在之前的線性迴歸中,我們的流程是:
這裡寫圖片描述
現在,在LWR中,與上面的不同之處只是在代價函式中加了個非負的權值w(i)
這裡寫圖片描述
w(i)

θ...y(i)θTx(i)2iw(i)i
w
這裡寫圖片描述
x|x(i)x|w(i)1|x(i)x|w(i)0
其實可以理解為:對於距離非常大的樣本,我們更加傾向於將其當成噪聲。
但是他有一個缺點:每次預測時都要重新計算預測樣本與“參考樣本”(訓練樣本)的距離,確定新的權重。因此當訓練樣本量很大時,該方法效率很低。
在上式中,τbandwidth