當損失函式為平方損失函式時，預測問題為迴歸問題時， $EPE(f)$ 可以分解為偏差與方差之和。此時， $EPE(f)$ 即 $MSE(f)$ （均分誤差），並有
$MSE(x_0)=E_T[f(x_0)-\hat y_0]^2=E_T[\hat y_0-E_T(\hat y_0)]^2+E_T[E_T(\hat y_0)-f(x_0)]^2$
其中 $f(x)$ 表示真實函式，分解的兩項中前者為方差，後者為偏差。

高維情況下的區域性方法

高維帶來的問題

弱化了“鄰域”的概念，使得鄰域在單一維度下的表現不像鄰域。（需要覆蓋單一維度下足夠大的跨度）
使得靠近樣本空間邊界的樣本點的比例增多
容易造成樣本空間的稀疏性
使均分誤差變大¹

結構化迴歸模型

在 $EPE(f)$ 中引入表徵結構複雜度的罰項，實際上是將對解空間模糊性的克服轉換為對約束條件（罰項）的選擇

均方誤差可以分解為偏差和方差之和，在不同的情況下，起支配作用的物件不同，比如當真實函式用到輸入資料的多維情況時，偏差容易起到支配作用；而當真實函式僅僅用到輸入資料的少量維度時，方容易起到支配作用。 ↩︎

《ESL》學習筆記-第二章 監督學習概述

文章目錄

變數的型別

定量變數Y

定性變數G

分類

舉例

編碼方式

兩種最簡單的估計模型

線性模型（使用最小二乘估計）

線性模型

最小二乘的解

聚類模型（使用最近鄰估計）

k-NN模型（k近鄰）

模型含義

兩種模型的差異

模型的型別

統計決策論

期望預測誤差

偏差-方差分解

高維情況下的區域性方法

高維帶來的問題

結構化迴歸模型

相關推薦

《ESL》學習筆記-第二章監督學習概述