機器學習之——欠擬合與過擬合

我從網上找了很多的資料，但是也沒有很明確的定義，大體上的意思就是：
欠擬合：模型擬合不夠，在訓練集(training set)上表現效果差，沒有充分利用資料，預測的準確率比我們設計的模型遠遠低很多，擬合結果嚴重的不符合預期。
解決辦法：增加模型的複雜度，不要用簡單的線性迴歸，適當的採用二次迴歸，將訓練集合擴大，採集更多的資料。

過擬合：模型過度擬合，在訓練集(training set)上表現好，但是在測試集上效果差，也就是說在已知的資料集合中非常好，在新增一些新的資料進來效果就會差很多，造成這樣的原因是考慮影響因素太多，超出自變數的維度過於多了。
解決辦法：減少模型的複雜度，適當的將訓練集合進行篩選。

首先介紹一下引數學習方法和非引數學習方法

引數學習方法：：在訓練完成所有資料後得到一系列訓練引數，然後根據訓練引數來預測新樣本的值，這時不再依賴之前的訓練資料了，引數值是確定的。

非引數學習方法：在預測新樣本值時候每次都會重新訓練資料得到新的引數值，也就是說每次預測新樣本都會依賴訓練資料集合，所以每次得到的引數值是不確定的，舉例：區域性加權迴歸。
1.區域性加權迴歸(LWR)
因為最開始預測的時候，我們是根據線性迴歸擬合的，存在欠擬合，為了避免這個問題，我們引入了區域性加權迴歸(LWR)，對所需要預測的 x 附近進行預測，因此每次都要做一次擬合，這樣雖然增加了一定的計算量，但是也避免了欠擬合現象。
首先需要引入一個權重函式 w

(i)=exp(−(x(i)−x)22T2)，這個權重函式並不是唯一的，只是為了方便我們引入的，也就是說：
如果 |x(i)−x|→0，那麼取值就是 1
如果 |x(i)−x|→∞，那麼取值就是 0 (e−∞→0)
所以我們定義的損失函式J(θ)=12∑mi=1w(i)(hθ(x(i))−y(i))2
所以，對於預測 x 來說，離預測樣本資料較近的點權值較大，離預測 x 樣本資料較遠的點權值較小，這樣擬合出來的直線就會更接近預測值。

缺點：當資料規模比較大的時候計算量很大，學習效率很低。並且區域性加權迴歸也不是一定就是避免欠擬合

2.選用誤差函式為平方和的概率解釋
假設線性函式 y

(i)=θx(i)+E(i)，前半部分就是我們根據最小二乘法計算出的向量表示式，後半部分是誤差（噪音）。一般來講，誤差滿足平均值為 0 的高斯（正態）分佈，即E(i)~N(0,σ2)。
E(i)=y(i)−θx(i)
那麼 x 和 y 的條件概率就滿足：P(y(i)|x(i);θ)=12πσ√∗exp(−(y(i)−θx(i))22σ2)
{y(i)|x(i);θ}服從N(θx(i),σ2)
這樣就估計了一條樣本的結果概率，然而我們期待的是模型能夠在全部樣本上預測最準，也就是概率積最大。這個概率積成為極大似然估計。我們希望在最大似然估計得到最大值時確定 θ 。稱L(θ) 為極大似然估計，因為每個 y 都是獨立同分布的，所以對於 m 個樣本就有：
L(θ)=∏mi=112πσ√∗exp(−(y(i)−θx(i))22σ2)
首先我們對其取對數，即：ln(θ)=∑mi=1log12πσ√∗exp(−(y

機器學習之——欠擬合與過擬合

機器學習之——欠擬合與過擬合

機器學習筆記2—— 欠擬合與過擬合

機器學習迴歸演算法—效能評估欠擬合與過擬合

機器學習中擬合與過擬合

偏差與方差，欠擬合與過擬合

【機器學習】線性迴歸演算法的過擬合比較

泛化能力、訓練集、測試集、K折交叉驗證、假設空間、欠擬合與過擬合、正則化（L1正則化、L2正則化）、超引數

欠擬合與過擬合的區別

Stanford機器學習---第三講. 邏輯迴歸和過擬合問題的解決 logistic Regression & Regularization

17.【進階】模型正則化--欠擬合與過擬合問題

【轉載】Stanford機器學習---第三講. 邏輯迴歸和過擬合問題的解決 logistic Regression & Regularization

機器學習之logistic迴歸演算法與程式碼實現

機器學習之路： python線性回歸過擬合 L1與L2正則化

機器學習之過擬合欠擬合

機器學習：偏差、方差與欠擬合、過擬合

機器學習（ML）七之模型選擇、欠擬合和過擬合

20171028機器學習之線性回歸過擬合問題的解決方案

吳恩達機器學習之過擬合問題

機器學習之擬合和過擬合問題

機器學習：欠擬合和過擬合

機器學習之——欠擬合與過擬合

相關推薦