1. 程式人生 > >證明二類分類問題的泛化誤差上界

證明二類分類問題的泛化誤差上界

泛化誤差上界:

對二分類問題,當假設空間是有限個函式的集合F={f1,f2,f3,...,fn}時,對任意一個函式f\epsilon F,至少以概率1-\delta,以下不等式成立:

R(f)\leq \hat{R}(f)+\varepsilon (d,N,\delta)

其中,\varepsilon (d,N,\delta )=\sqrt{1/2N(logd+log(1/\delta ))}

不等式右端第一項為訓練誤差,訓練誤差越小,泛化誤差就越小

第二項為N的單調遞減函式,當N趨於無窮時其趨於0,且假設空間包含的函式越多,其值越大

以下為證明過程:

首先,因為證明過程要用到Hoeffding不等式,敘述如下:

S_{n}=\sum_{i=1}^{n}X_{i}是獨立隨機變數X1,X2,...,Xn之和,X_{i}\epsilon [ai,bi],則對任意t>0,以下不等式成立:

P(S_{n}-ES_{n}\geq t)\leq exp(\frac{-2t^{2}}{\sum_{i=1}^{n}(bi-ai)^{2} })

P(ES_{n}-S_{n}\geq t)\leq exp(\frac{-2t^{2}}{\sum_{i=1}^{n}(bi-ai)^{2} })

現有,對任意f\epsilon F\hat{R}(f)是N個獨立隨機變數L(Y,f(X))的樣本均值,R(f)是隨機變數L(Y,f(X))的期望值,損失函式取值於區間[0,1],即對所有i,[ai,bi]=[0,1]則有:

S_{n}=\sum_{i=1}^{N}L(Y_{i},f(X_{i}))=NR(f)

E(S_{n})=E(\sum_{i=1}^{N}L(Y_{i},f(X_{i})))=\sum_{i=1}^{N}(E(L(Y_{i},f(X_{i})))=\sum_{i=1}^{N}\hat{R}(f)=N\hat{R}(f)

因為P(NR(f)-N\hat{R}(f)\geq N\varepsilon )=P(R(f)-\hat{R}(f)\geq \varepsilon )

因此,由Hoeffding不等式得:

P(R(f)-\hat{R}(f)\geq \varepsilon ) \leq exp(-2(N\varepsilon )^{2}/N)=exp(-2N\varepsilon ^{2})

因為,假設空間是一個有限集合,則有:

P(R(f)-\hat{R}(f)\geq \varepsilon )\leq dexp(-2N \varepsilon ^{2})

等價於:

P(R(f)-\hat{R}(f)\leq \varepsilon )\geq 1-dexp(-2N \varepsilon ^{2})

dexp(-2N \varepsilon ^{2})= \delta,則至少以概率1-\deltaR(f)< \hat{R}(f)+ \varepsilon成立

因此,訓練誤差小的模型,泛化誤差也會小