Coursera機器學習基石筆記week7
The VC Dimension
Definition of VC Dimension
VC dimension就是滿足成長函式
的最大的N。也就是
=‘minimum k’-1.
VC Dimension of Perceptrons
已知在1D Perceptron, ,在2D Perceptrons, ,那麼我們有如下假設: ,其中d為維數。如果我們要證明的話,需要分為兩步:
首先證明 :
在d維裡,我們只要找到某一類的d+1個inputs可以被shatter的話,那麼必然得到
。所以,構造一個d維的矩陣X能夠被shatter就行。X是d維的,有d+1個inputs,每個inputs加上第零個維度的常數項1(threshold),得到X的矩陣:
這是一個(d+1)*(d+1)的矩陣,且有d+1組線性無關向量,則該矩陣是非奇異的,也就是可逆的。shatter的本質是假設空間H對X的所有情況的判斷都是對的,即總能找到權重W,滿足
,
。因為可逆針對任意一個y都可以由X矩陣得到對應的權重w。那麼說明
。
然後證明 :
那麼需要證明對於任意d+2個inputs無法被shatter,那麼就可以證明不等式成立。我們構造一個任意的矩陣X,其包含d+2個inputs,該矩陣有d+1列,d+2行。這d+2個向量的某一列一定可以被另外d+1個向量線性表示,例如對於向量Xd+2Xd+2,可表示為:
其中,假設a1>0,a2,⋯, <0
那麼如果
是正類,
均為負類,則存在W,得到如下表達式:
因為其中
大於0,代表正類;
小於0,代表負類。所有對於這種情況,
一定是正類,無法得到負類的情況。也就是說,d+2個inputs無法被shatter。
因此可以證明
Physical Intuition of VC Dimension
w又可以叫做自由度,就像是上圖中的旋鈕一樣可以自由的調節。
vc dimension又代表了可以產生dichotomy 的數量。
Interpreting VC Dimension
已知VC bound:
我們讓
等於VC bound。那麼我們想要得到好的情況,那麼:
經過上述計算,我們推匯出了
的值。ϵ表現了假設空間H的泛化能力,ϵ越小,泛化能力越大。
上圖,紅色部分代表了模型複雜度,其與樣本數量N,
,
有關。根據上圖的關係,我們可以繪出相關的趨勢:
根據上述趨勢,我們不能一味的減小
的值,因為隨著
的變小,模型複雜度在變大,導致泛化能力變小,導致
先變大再變小。
根據以上圖片可以看出,在