線性迴歸
$J_{test}(\Theta) = \frac{1}{2m_{test}}\sum_{i=1}^{m_{test}}(h_\Theta(x^{(i)}_{test}-y^{(i)}_{test}))^2$
邏輯迴歸
2.1 分類誤差 0/1
$err(h_\Theta(x),y) = \begin{cases} 1 &if\quad h_\Theta(x)\ge0.5\quad and\quad y=0\quad or\quad h_\Theta(x)\lt0.5\quad and\quad y=1 \\ 0 &otherwise \end{cases}$
上式將錯誤分類用0或1進行了標識，所以測試集的平均誤差為：
$Test Error = \frac{1}{2m_{test}}\sum_{i=1}^{m_{test}}err(h_\Theta(x^{(i)}_{test}),y^{(i)}_{test})$
上式揭示了根據測試集的輸入特徵錯誤分類的比例。
2.2 代價函式
$J_{test}(\Theta) = -\frac{1}{m_{test}}\sum_{i=1}^{m_{test}}(y^{(i)}log(h_\Theta(x^{(i)})+(1-y^{(i)})log(1-h_\Theta(x^{(i)})))$

訓練集+驗證集+測試集

如果有多個模型可以選擇，例如可以選擇多個多項式次數不同的模型，那麼，可以通過驗證集對模型進行選擇，再利用測試集評估泛化誤差。（如果只有訓練集和測試集，用測試集同時進行模型選擇和誤差評估是不合理的，因為通過模型選擇後，測試集已經與模型相匹配，很難再用於泛化評估）

訓練集、驗證集和測試集的比例為6:2:2。

診斷：偏差 vs 方差

高偏差指欠擬合；高方差指過擬合。

多項式次數與偏差和方差診斷的關係

在這裡插入圖片描述

隨著假設函式中多項式次數（特徵）的增多，對於訓練集的誤差越來越小，而對於驗證集的誤差先降後升。

訓練集誤差和驗證集誤差均高且近似相等時診斷為高偏差；
訓練集誤差低，而驗證集誤差高時診斷為高方差。

正則化和偏差/方差

正則化引數 $\lambda$ 過小時，有可能過擬合，過大時，有可能欠擬合。

隨著 $\lambda$ 增大，對於訓練集的誤差越來越大，而對於驗證集的誤差先降後升。

訓練集誤差和驗證集誤差均高且近似相等時診斷為高偏差；
訓練集誤差低，而驗證集誤差高時診斷為高方差。

可以通過以下步驟選擇合適的 $\lambda$ ：
2.1 生成若干個 $\lambda$ ，如 $\lambda=1:0.01:10$
2.2 生成一系列模型，對應不同的 $\lambda$
2.3 通過訓練集訓練得到各模型的模型引數
2.4 通過驗證集計算驗證誤差（計算時忽略代價函式中的正則項），並選出驗證誤差最小的模型作為最優模型
2.5 將測試集應用於最優模型以預測泛化效能。

學習曲線（訓練樣本/訓練集數量與偏差和方差）

當訓練樣本增多，訓練集的誤差越來越大，而驗證集的誤差卻越來越小。在訓練樣本數量達到一定程度後，訓練集和驗證集的誤差近似。

如果增加訓練樣本的情況下，訓練集的誤差和驗證集的誤差不變，且均高於理想水平，則有可能高偏差（同時可見，增加訓練樣本不能解決高偏差的問題）PS：快速聚攏的就是高偏差，因為如果是正常情況，則兩種誤差應當相似，如果一開始驗證集誤差比訓練集誤差高，則要麼高偏差，要麼高方差
如果在增加訓練樣本的情況下，驗證集的誤差平緩下降，訓練集的誤差平緩上升，且它們之間有明顯的差距，則有可能高方差（同時可見，增加訓練樣本可以解決高方差時，它們向理想水平靠攏）PS：訓練樣本增加到一定程度後，兩者之間在很長一段期間內還保持一定差距，那就說明是高方差了

診斷後的調整

調整方式可列舉如下：

增加訓練樣本 - 高方差
減少特徵 - 高方差
增加特徵（額外的特徵或增加多項式次數） - 高偏差
減小 $\lambda$ - 高偏差
增加 $\lambda$ - 高方差

評估神經網路

過擬合/欠擬合

一個簡易的神經網路傾向於欠擬合(計算量小)
一個大型的神經網路傾向於過擬合(計算量大；可以使用正則化來解決過擬合)

平衡偏差和方差

利用訓練集，從訓練包含一個隱藏層的神經網路依次

機器學習6：評估

評估+設計雜談

評估模型(假設函式)

訓練集+測試集

測試集的誤差

訓練集+驗證集+測試集

診斷：偏差 vs 方差

診斷後的調整

評估神經網路

過擬合/欠擬合

平衡偏差和方差

機器學習6：評估

Spark機器學習(6)：決策樹算法

機器學習6：邏輯迴歸到深度學習的思考

機器學習-6：DeepLN之CNN原始碼

機器學習演算法：交叉驗證——（監督）學習器效能評估方法 [ sklearn.model_selection.cross_val_score()官方翻譯 ]

吳恩達-機器學習(6)-評估學習演算法、偏差與方差、構架垃圾郵件分類器、處理傾斜資料

機器學習-2：MachineLN之模型評估

6個步驟從頭開始編寫機器學習演算法：感知器案例研究

機器學習(3)：信息論

Spark機器學習(5)：SVM算法

機器學習入門：線性回歸及梯度下降

Spark機器學習(8)：LDA主題模型算法

Bat腳本學習-6：Oracle自動備份還原腳本

Spark機器學習(10)：ALS交替最小二乘算法

Spark機器學習(11)：協同過濾算法

機器學習1：數據預處理

Python機器學習(1)：KMeans聚類

機器學習基礎4--評估線性分類

Python機器學習筆記：利用Keras進行多類分類

python 機器學習中模型評估和調參

機器學習6：評估

評估+設計雜談

評估模型(假設函式)

訓練集+測試集

測試集的誤差

訓練集+驗證集+測試集

診斷：偏差 vs 方差

診斷後的調整

評估神經網路

過擬合/欠擬合

平衡偏差和方差

相關推薦