線性迴歸-4-欠擬合、過擬合與區域性加權線性迴歸

欠擬合、過擬合

線上性迴歸問題中，我們可以通過改變θ的個數或者x的指數大小來獲得不同形狀的擬合曲線看下面的圖：
這裡寫圖片描述
左邊的曲線是在假設y=θ0+θ1x時的擬合結果，但顯然中間的曲線要比左邊的擬合效果更好。我們稱左邊的情況為欠擬合（underfitting）。
這樣看來右邊的不是比左邊更好嗎？！。。。NO！我們稱右邊的情況為過擬合(overfitting)！因為它已經不能反應出樣本的整體分佈情況！

區域性加權線性迴歸（LWR）

在之前的線性迴歸中，我們的流程是：
這裡寫圖片描述
現在，在LWR中，與上面的不同之處只是在代價函式中加了個非負的權值w(i)：

當我們給w(i)一個很大的值時，

在計算選擇θ時，就會更加...更加盡可能的讓（y(i)−θTx(i)）2的值小。也就是說我們更加重視第i個樣本。同理，當w(i)很小很小時，也就代表我們基本可以忽略第i個樣本
一般而言我們選擇權重w的規則如下：
這裡寫圖片描述

其中x是要預測的樣本，可以看出：當|x(i)−x|越小時，權重w(i)越接近1；當|x(i)−x|越大時，權重w(i)越接近0
其實可以理解為：對於距離非常大的樣本，我們更加傾向於將其當成噪聲。
但是他有一個缺點：每次預測時都要重新計算預測樣本與“參考樣本”（訓練樣本）的距離，確定新的權重。因此當訓練樣本量很大時，該方法效率很低。
在上式中，τ稱為波長（bandwidth）

參數，它控

線性迴歸-4-欠擬合、過擬合與區域性加權線性迴歸

欠擬合、過擬合

區域性加權線性迴歸（LWR）

線性迴歸-4-欠擬合、過擬合與區域性加權線性迴歸

Pytorch_第八篇_深度學習 (DeepLearning) 基礎 [4]---欠擬合、過擬合與正則化

容量、欠擬合、過擬合和正則化

欠擬合、過擬合、偏差、方差

偏差、方差、欠擬合、過擬合

欠擬合、過擬合、梯度爆炸、梯度消失等問題的原因與大概解決方法

機器學習：偏差、方差與欠擬合、過擬合

欠擬合、過擬合——解決方法

吳恩達-機器學習(3)-分類、邏輯迴歸、多分類、過擬合

機器學習（ML）七之模型選擇、欠擬合和過擬合

梯度下降、過擬合和歸一化

機器學習：欠擬合和過擬合

模型選擇，欠擬合，過擬合

學習曲線檢查模型欠擬合&過擬合

決策數演算法進階：屬性測試條件、最佳劃分度量、過擬合現象的處理

機器學習概念篇：監督學習、過擬合，正則化，泛化能力等概念以及防止過擬合方法總結

機器學習筆記05：正則化(Regularization)、過擬合(Overfitting)

機器學習之擬合和過擬合問題

機器學習基礎（三十） —— 線性迴歸、正則化（regularized）線性迴歸、區域性加權線性迴歸（LWLR）

python手寫多項式擬合、曲線擬合

線性迴歸-4-欠擬合、過擬合與區域性加權線性迴歸

欠擬合、過擬合

區域性加權線性迴歸（LWR）

相關推薦