線性迴歸-4-欠擬合、過擬合與區域性加權線性迴歸
阿新 • • 發佈:2019-02-10
欠擬合、過擬合
線上性迴歸問題中,我們可以通過改變
左邊的曲線是在假設
這樣看來右邊的不是比左邊更好嗎?!。。。NO!我們稱右邊的情況為過擬合(overfitting)!因為它已經不能反應出樣本的整體分佈情況!
區域性加權線性迴歸(LWR)
在之前的線性迴歸中,我們的流程是:
現在,在LWR中,與上面的不同之處只是在代價函式中加了個非負的權值
在計算選擇θ時,就會更加...更加盡可能的讓(y(i)−θTx(i))2的值小。也就是說我們更加重視第i個樣本。同理,當w(i)很小很小時,也就代表我們基本可以忽略第i個樣本
其實可以理解為:對於距離非常大的樣本,我們更加傾向於將其當成噪聲。
但是他有一個缺點:每次預測時都要重新計算預測樣本與“參考樣本”(訓練樣本)的距離,確定新的權重。因此當訓練樣本量很大時,該方法效率很低。
在上式中, 參數,它控