1. 程式人生 > >《機器學習》周志華第一章參考答案

《機器學習》周志華第一章參考答案

1.1 版本空間

答:一共有7種。
因為所有的好瓜壞瓜分別只有一種,所以可以由最特殊的逐步“泛化”,只要不是全部為*就不會出錯。同時存在好瓜的樣本,則一定不是空集。
1. 青綠^蜷曲^濁響=好瓜
2. *^蜷曲^濁響=好瓜
3. 青綠^ * ^濁響=好瓜
4. 青綠^蜷曲^ * =好瓜
5. 青綠^ * ^ * =好瓜
6. * ^蜷曲^ * =好瓜
7. * ^ * ^濁響=好瓜

1.2估算假設空間大小

答:首先單個合取式有3*4*4=49種;

這裡要說明一下,資料是完全按照表1.1進行計算,在表1.1中,色澤只有青綠和烏黑,不考慮下文中作者的假設中包含的淺白。如果考慮淺白,則這裡答案4*4*4+1=65種。
在不考慮任何冗餘的情況下,是一個簡單的組合問題,從49中選擇1/2/3/…/k個的組合之和。
考慮冗餘,= =好難。

1.3偏好設計

首先有可能不存在與所有訓練樣本都一致的假設,也就意味著出現了特徵完全一樣但是label不一樣。具體來說就是,只要沒有出現【特徵一樣label不一樣】的情況,最少能找到一個唯一的限定的假設。比如拿西瓜來說,不管資料怎樣,只要沒有矛盾的資料,我們可以把每種情況都列出來作為最終假設。
下面是我的一些偏好:
1. 謹慎。對於出現訓練樣本特徵一樣label不一致的,則把所有不一致資料都作為不可用資料。
2. 樂觀。對於不一致的則認為是【好瓜】。
3. 悲觀。【壞瓜】

1.4證明

答:之前是嚴格的true or false,如果h(x)=f(x)則認為沒有誤差,一旦不相等則記為一次誤差。這裡用l()函式,可以認為l是一個度量h(x)與f(x)之間差距的函式。證明過程略了,數學功底不夠。

1.5機器學習在網際網路搜尋哪些環節起作用

答:預測輸入,輸入匹配,網頁匹配度,智慧抓取,預載入,網頁排序。