1. 程式人生 > >機器學習基石第六講筆記

機器學習基石第六講筆記

Lecture 6:theory of generalization一般化理論

6-1 Restriction of Break Points 

成長函式m:假說h在n個點上可以產生多少個二分(dichotomies)。

若正向o,反向×,則

理解程度一般,positive intervals為什麼xox可以呢?

這種情況認為x2和x3是被shatter的(4種情況都涵蓋全了)。

break point=2的意思:任意兩個點都不能shatter。

而這種情況是不能被shatter的,證明4種dichotomies是可以的。

而當5種dichotomies時,必有兩個x,所以肯定有兩個引數x是會被shatter的。

所以在這裡的maximum possible(也就是成長函式m)是4種。

上面的x1,x2,x3的情況是N=3的。

這節的fun time是break point=1,N=3時,只能有1種成長函式m,原因如圖:

第二種情況加進來,不管怎麼加,都會有一個引數x同時有x和o的情況。(此時假設的條件是一個都不能shatter)

6-2 Bounding Function (上限函式B)

關注的問題:到底可以做出多少種排列組合?

B(N,k)總共N個維度,任意k維都確保不能shatter,這時能有幾種dichotomies。

成長函式m和B的關係:m<B(B是m的上限)

當N<k時,就相當於任意N維不能shatter,所以此時是2^N。

當N=k時,全部結果是不能shatter的,所以要減一種,最後結果是2^N-1。

加上6-1最後兩圖的情況,目前有:

6-3 Bounding Function (上限函式B)-Inductive cases

現在想做的是填寫6-2圖表中的其他值。

用程式找到B(4,3)=11  4+7=11=2alpha+beta

這時要求alpha+beta<B(3,3)且alpha<B(3,2)  故2alpha+beta<B(3,3)+B(3,2)

推廣到B(N,k) 有:

填寫完大致的表:

成長函式m的上限是上限函式B,上限函式B的上限是某個多項式函式poly(N)。

所以,我們可以得到結論:成長函式最多,也就只能夠和某個多項式函式的值一樣大。如圖:

6-4 A Pictorial Proof

本節的內容是講解公式中的三個常數是怎麼算出來的(不是從數學上,而是從邏輯上)。

這裡不做過多的講解啦(覺得不是重要的內容)。下次學第七課!

注:圖片全部來自臺大林軒田教授《機器學習基石》視訊課程截圖。