機器學習筆記2—— 欠擬合與過擬合

區域性加權迴歸

現在思考關於根據實數 x 預測 y 的問題。

上圖中最左側的圖顯示了函式 y=θ0+θ1x 擬合數據集的結果。我們可以看到資料並沒有真的停靠在直線上，所以這種擬合效果並不是非常好。
相反地，如果我們新增額外的特徵 x2，然後用函式擬合 y=θ0+θ1x1+θ2x2，我們會得到一個稍微更好的擬合數據的結果（看中間的圖）。看上去我們新增的特徵越多，擬合的效果就越好。然而，新增過多的特徵也有問題。最右側的圖中顯示了包含五個特徵的函式的擬合結果 y=∑5j=0θjxj。我們可以看到即使擬合的曲線完美的經過了所有的資料點，我們也不會認為這是一個非常好的預測房價的假設。

在沒有正式定義這種現象代表什麼的前提下，我們稱左側圖是欠擬合

的案例，即建立的模型明顯沒有捕獲到資料；稱右側圖中的現象為 過擬合 的例子（這節課之後我們會介紹規定的這些符號的一些理論知識，並且會更小心的定義，對於一個假設來說這究竟意味著是好的還是壞的）。

綜上的案例與討論，我們意識到特徵的選擇對確保一個學習演算法表現良好非常重要（當我們討論到模型選擇時，我們也會了解一些自動選擇良好特徵的演算法）。

在這一小節中，我們要討論關於區域性加權線性迴歸（LWR）演算法，這種演算法在訓練資料足夠的前提下，能削弱特徵選擇的影響。這一過程比較簡短，更多關於LWR演算法的特性需要你們在作業中發現。

在原始的線性迴歸演算法中，為了對一系列輸入值 x 做出預測，我們會：

調整引數 θ 以最小化 ∑i(yi−θTxi)2

2.輸出 θTx

相反的是，區域性加權線性迴歸演算法執行下列步驟：

調整引數 θ以最小化 ∑iw(i)(y(i)−θTx(i))2

2.輸出 θTx

這裡的 w(i) 是非負的權值。可以看出，如果對於特定值i權值w(i)非常大，無論如何取θ，我們都很難讓(y(i)−θTx(i))2 減小。如果權值很小，那麼誤差項(y(i)−θTx(i))2在擬合過程中會被忽略掉。

對於權值來說一個恰當的選擇是：

要知道權值的大小取決於我們嘗試預測的特定點x。如果 |x(i)−x|很小，那麼權值w(i)會趨近於1；相反如果如果 |

x(i)−x|很大，權值w(i)會很小，因此，引數θ應該調整為越靠近查詢點 x的訓練樣本權值越高。（要知道盡管權值的表現形式與高斯分佈相似，但權值w(i) 與高斯分佈並沒有直接關係，且權值w(i) 也不是隨機變數、正態分佈或是其他形式的分佈。）隨著訓練樣本與查詢點x距離越遠，引數τ控制權值下降的速度。τ被稱作頻寬引數，這一符號的概念需要你們做作業去了解。

區域性加權線性迴歸是我們瞭解到的第一個非引數演算法的例子。我們之前知道的（未加權）線性迴歸屬於引數學習演算法，因為在擬合數據的過程中，存在需要不斷調整、且數量有限的引數（θi’s）。一旦我們確定並存儲這些引數θi’s，我們不會繼續維持著資料集來做預測。相反，通過區域性加權線性迴歸演算法做預測，需要一直維持著整個資料集。非引數演算法的形式指出了事實：隨著做預測的資料集的規模越大，需要維持的數量級就越多。

概率解釋

當我們面對迴歸問題時，為什麼會認為線性迴歸和最小二乘成本函式J可能是合理的選擇呢？在這一小節，我們會給出一系列的概率解釋，根據最小二乘迴歸推匯出一個非常自然的演算法。

假設目標變數和輸入變數之間的關係由如下等式表示：

等式中的ε(i)代表誤差項，用來捕獲未建模的影響（比如如果有一些與預測房價非常相關的特徵，但我們並沒有選擇）或是隨機噪聲。根據高斯分佈（也叫做正態分佈）的零均值和方差σ2，可以進一步假設ε(i)是獨立同分布的（獨立且相同的分佈）。

疑問：為什麼符合高斯分佈呢？吳恩達的解釋有兩個：1.便於數學處理 2.中心極限定理等眾多理論可以證明，高斯分佈是一個合理的假設。

可以將上述假設寫成ε(i) ~ N(0,σ2)，即誤差項ε(i)的概率密度函式如下：

這意味著：

符號 p(y(i)|x(i);θ) 講義中的解讀解釋如下：this is the distribution of y(i

機器學習筆記2—— 欠擬合與過擬合

區域性加權迴歸

概率解釋

機器學習筆記2—— 欠擬合與過擬合

Bobo老師機器學習筆記第八課-如何防止過擬合和欠擬合？

Andrew Ng機器學習筆記2——梯度下降法and最小二乘擬合

機器學習之——欠擬合與過擬合

機器學習迴歸演算法—效能評估欠擬合與過擬合

機器學習中擬合與過擬合

Jmeter學習筆記2-原件作用域與執行順序

吳恩達機器學習筆記2-監督學習

偏差與方差，欠擬合與過擬合

深入理解Java虛擬機器讀書筆記2----垃圾收集器與記憶體分配策略

Redis學習筆記(2)-redis的啟動與關閉

深入理解Java虛擬機器學習筆記2-JVM中物件佈局

泛化能力、訓練集、測試集、K折交叉驗證、假設空間、欠擬合與過擬合、正則化（L1正則化、L2正則化）、超引數

欠擬合與過擬合的區別

機器學習筆記2：線性迴歸

17.【進階】模型正則化--欠擬合與過擬合問題

機器學習筆記2

吳恩達機器學習筆記2-代價函數(cost function)

吳恩達機器學習筆記2-代價函式(cost function)

吳恩達機器學習筆記 —— 2 單變數線性迴歸

機器學習筆記2—— 欠擬合與過擬合

區域性加權迴歸

概率解釋

相關推薦