1. 程式人生 > >《統計學習方法》第一章:統計學習方法概論3

《統計學習方法》第一章:統計學習方法概論3

3、統計學習的三要素

統計學習方法 = 模型 + 策略 + 演算法

3.1、模型

模型就是所要學習的條件概率分佈或決策函式(具體演算法通常是兩者之一)。
模型的假設空間Γ包含所有可能的條件概率分佈或決策函式,假設決策函式是輸入變數的線性組合,那麼模型的假設空間就是所有這些線性函式構成的函式集合,假設空間中的模型一般有無數多個。

假設空間Γ定義為決策函式的集合:

Γ={f|Y=f(X))}
其中X和Y是定義在輸入空間和輸出空間上的變數,而Γ通常是由一個引數向量決定的函式族:
Γ={f|Y=fθ(X),
θϵRn}

引數向量θ取值於n維歐氏空間Rn,簡稱引數空間。

假設空間Γ定義為條件概率的集合:

Γ={P|P(Y|X)}
其中X和Y是定義在輸入空間和輸出空間上的變數,而Γ通常是由一個引數向量決定的條件概率分佈族:
Γ={P|Pθ(Y|X),θϵRn}
引數向量θ取值於n維歐氏空間Rn,簡稱引數空間。

3.2、策略

有了假設空間,統計學習需要考慮按照什麼樣的準則學習或按照什麼樣的準則選擇最優的模型。

損失函式:度量模型一次預測的好壞。

從假設空間Γ中選擇模型f作為決策函式,叢輸入到對應的輸出可能於原來的不一致,用損失函式度量預測錯誤的程度。
1、0-1損失函式

L(Y,f(X))={1,Yf(X)0,Y=f(X)
2、平方損失函式
L(Y,f(X))=(Yf(X))2
3、絕對損失函式
L(Y,f(X))=|Yf(X)|
4、對數損失函式/對數似然損失函式
L(Y,P(Y|X))=logP(Y|X)

風險函式/期望損失/期望風險:平均意義下模型預測的好壞。

損失函式越小,模型越好,由於模型的輸入和輸出是隨機變數,遵循聯合分佈P(X,Y),損失函式的期望是:

Rexp(f)=Ep[L(Y,f(X))]=xyL(y,f(x))P(x,y)dxdy

經驗風險:關於訓練資料集的平均損失

由於聯合分佈P(X,Y)未知,期望風險沒辦法直接計算,對於基於有限訓練資料集: