1. 程式人生 > >機器學習(周志華)課後習題一:緒論

機器學習(周志華)課後習題一:緒論

1 表1.1中若只包含編號為1和4的兩個樣例,試給出相應的版本空間

編號 色澤 根蒂 敲聲 好瓜
1 青綠 蜷縮 濁響
4 烏黑 稍蜷 沉悶

根據表格可看出,每個屬性有兩個選項,而且加上萬用字元“*”,即每個屬性有3個選項,再加上3個屬性全是萬用字元的情況。因此假設空間總共有3*3*3+1=28種情況。而這28種情況中,好瓜的版本空間是(一般版本空間指正例泛化):

色澤 根蒂 敲聲
青綠 蜷縮 濁響
青綠 蜷縮 *
青綠 * 濁響
* 蜷縮 濁響
青綠 * *
* 蜷縮 *
* * 濁響

2 估算多少種可能的假設

3 設計一種歸納偏好用於假設選擇

首先由題可得,假設空間中有可能存在與所有訓練樣本都不一致的假設,即“屬性都一致,但label不一致”。就比如1中的“青綠^蜷縮^濁響”在訓練樣本中是好瓜(label),但是在實際假設中卻存在壞瓜的情況。這種時候,可以有以下幾種做法。
- 認為都是好瓜
- 認為都是壞瓜
- 將這一組資料(“青綠^蜷縮^濁響”)去掉,這樣就不用糾結,但是會丟失資訊

4 試證明“NFL”定理仍成立

數學功底不夠,就不做過程了,但是感覺這裡的“l()”函式應該就是用來表示f(x)與h(x)之間的距離的函式

5 機器學習在網際網路搜尋中的作用

“猜你喜歡”功能,搜尋時預搜尋等等