《機器學習》周志華學習筆記第一章緒論（課後習題）

阿新 • • 發佈：2019-01-17

最近需要學習機器學習，有一點點基礎但是很少，希望能通過寫部落格的方式和大家交流以及學習達到共同進步的目的。

緒論：

一、內容

1.基本術語

2.假設空間與版本空間

3.歸納偏好（常用的有奧卡姆剃刀）沒有免費的午餐定理（No Free Lunch Theorem,NFL，前提建設f均勻分佈）式（1.2）顯示總誤差竟然與學習演算法無關！告訴我們要談論演算法的相對優劣，必須要針對具體的學習問題。學習演算法自身的歸納偏好與問題是否匹配，往往會起到決定性的作用！

二、課後答案：

1、表1.1中若只包含編號為1，4的兩個樣例，試給出相應的版本空間。

首先求出這個問題的假設空間。資料集有3個屬性，每個屬性2種取值，加上可能取所有值都合適，‘*’，以及可能所有瓜都不是好瓜的取值空值，一共 3∗3∗3+1=28種假設，分別為

1.色澤=青綠根蒂=蜷縮敲聲=濁響

2.色澤=青綠根蒂=蜷縮敲聲=沉悶

3.色澤=青綠根蒂=稍蜷敲聲=濁響

4.色澤=青綠根蒂=稍蜷敲聲=沉悶

5.色澤=烏黑根蒂=蜷縮敲聲=濁響

6.色澤=烏黑根蒂=蜷縮敲聲=沉悶

7.色澤=烏黑根蒂=稍蜷敲聲=濁響

8.色澤=烏黑根蒂=稍蜷敲聲=沉悶

9.色澤=青綠根蒂=蜷縮敲聲=*

10.色澤=青綠根蒂=稍蜷敲聲=*

11.色澤=烏黑根蒂=蜷縮敲聲=*

12.色澤=烏黑根蒂=稍蜷敲聲=*

13.色澤=青綠根蒂=* 敲聲=濁響

14.色澤=青綠根蒂=* 敲聲=沉悶

15.色澤=烏黑根蒂=* 敲聲=濁響

16.色澤=烏黑根蒂=* 敲聲=沉悶

17.色澤=* 根蒂=蜷縮敲聲=濁響

18.色澤=* 根蒂=蜷縮敲聲=沉悶

19.色澤=* 根蒂=稍蜷敲聲=濁響

20.色澤=* 根蒂=稍蜷敲聲=沉悶

21.色澤=青綠根蒂=* 敲聲=*

22.色澤=烏黑根蒂=* 敲聲=*

23.色澤=* 根蒂=蜷縮敲聲=*

24.色澤=* 根蒂=稍蜷敲聲=*

25.色澤=* 根蒂=* 敲聲=濁響

26.色澤=* 根蒂=* 敲聲=沉悶

27.色澤=* 根蒂=* 敲聲=*

28.空集Ø

版本空間是與訓練集一致的假設集合，因此我們根據資料1,4分別對假設空間中的假設進行搜尋，搜尋過程不斷刪除與正例不一致的假設，和與反例一致的假設。最終獲得與訓練集一致的假設即可。

得到的版本空間如下：

1.色澤=青綠根蒂=蜷縮敲聲=濁響

9.色澤=青綠根蒂=蜷縮敲聲=*

13.色澤=青綠根蒂=* 敲聲=濁響

17.色澤=* 根蒂=蜷縮敲聲=濁響

21.色澤=青綠根蒂=* 敲聲=*

23.色澤=* 根蒂=蜷縮敲聲=*

25.色澤=* 根蒂=* 敲聲=濁響

2、與使用單個合取式來進行假設表示相比，使用“析合正規化”將使得假設空間具有更強的表示能力。若使用最多包含k個合取式的析合正規化來表達1.1的西瓜分類問題的假設空間，試估算有多少種可能的假設

這個也是參考了其他人的答案，沒有看明白，有興趣的同學可以去頁面底部檢視連結文章。

3、若資料包含噪聲，則假設空間中可能不存在與所有訓練樣本都一致的假設。在此情形下，試設計一種歸納偏好用於假設選擇

通常認為兩個資料的屬性越相近，則更傾向於將他們分為同一類。若相同屬性出現了兩種不同的分類，則認為它屬於與他最臨近幾個資料的屬性。也可以考慮同時去掉所有具有相同屬性而不同分類的資料，留下的資料就是沒誤差的資料，但是可能會丟失部分資訊。

4、本章1.4節在論述“沒有免費的午餐”定理時，預設使用了“分類錯誤率”作為效能度量來對分類器進行評估。若換用其他效能度量l，試證明沒有免費的午餐”定理仍成立

考慮二分類問題，真實目標函式可以是任何函式X->{0, 1},函式空間為2的|X|平方，對所有的可能的f按均勻分佈對誤差求和，對l(f(x), h(x))求和是一個常數，所有最後結果與（1.2）除前邊的常數外其他一樣。我覺得這個定理最重要的就是要明白前提f滿足均勻分佈。

5.試述機器學習在網際網路搜尋的哪些環節起什麼作用

1.訊息推送，相關推薦

2.分類搜尋

《機器學習》周志華學習筆記第一章緒論（課後習題）

最近需要學習機器學習，有一點點基礎但是很少，希望能通過寫部落格的方式和大家交流以及學習達到共同進步的目的。

緒論：

一、內容

二、課後答案：

1、表1.1中若只包含編號為1，4的兩個樣例，試給出相應的版本空間。

2、與使用單個合取式來進行假設表示相比，使用“析合正規化”將使得假設空間具有更強的表示能力。若使用最多包含k個合取式的析合正規化來表達1.1的西瓜分類問題的假設空間，試估算有多少種可能的假設

3、若資料包含噪聲，則假設空間中可能不存在與所有訓練樣本都一致的假設。在此情形下，試設計一種歸納偏好用於假設選擇

4、本章1.4節在論述“沒有免費的午餐”定理時，預設使用了“分類錯誤率”作為效能度量來對分類器進行評估。若換用其他效能度量l，試證明沒有免費的午餐”定理仍成立

5.試述機器學習在網際網路搜尋的哪些環節起什麼作用

《機器學習》周志華學習筆記第一章緒論（課後習題）

機器學習(周志華) 參考答案第一章緒論

機器學習(周志華) 參考答案第一章緒論 1.2

(周志華)讀書筆記 -- 第一章緒論

機器學習(周志華) 參考答案第二章模型評估與選擇

(周志華)讀書筆記 -- 第二章模型評估與選擇

作業系統第一章——概論（課後習題解答）

機器學習-周志華-第一章

《機器學習-西瓜書》-周志華-學習筆記系列（1）--序言、前言和主要符號表

《機器學習》周志華學習筆記第四章決策樹（課後習題）python 實現

《機器學習》周志華學習筆記第三章線性模型（課後習題）python 實現

《機器學習》周志華學習筆記第八章整合學習（課後習題）python實現

《機器學習》周志華學習筆記第六章支援向量機（課後習題）python 實現

《機器學習》周志華學習筆記第五章神經網路（課後習題） python實現

《機器學習》周志華學習筆記第七章貝葉斯分類器（課後習題）python 實現

《機器學習》周志華學習筆記第十四章概率圖模型（課後習題）python實現

機器學習周志華筆記

《機器學習》周志華讀書筆記2（原創）

《機器學習》周志華讀書筆記1（原創）

學習筆記 | 機器學習-周志華 | 5

《機器學習》 周志華學習筆記第一章 緒論（課後習題）

最近需要學習機器學習，有一點點基礎但是很少，希望能通過寫部落格的方式和大家交流以及學習達到共同進步的目的。

緒論 ：

一、內容

二、課後答案：

1、表1.1中若只包含編號為1，4的兩個樣例，試給出相應的版本空間。

2、與使用單個合取式來進行假設表示相比，使用“析合正規化”將使得假設空間具有更強的表示能力。若使用最多包含k個合取式的析合正規化來表達1.1的西瓜分類問題的假設空間，試估算有多少種可能的假設

3、若資料包含噪聲，則假設空間中可能不存在與所有訓練樣本都一致的假設。在此情形下，試設計一種歸納偏好用於假設選擇

4、本章1.4節在論述“沒有免費的午餐”定理時，預設使用了“分類錯誤率”作為效能度量來對分類器進行評估。若換用其他效能度量l，試證明沒有免費的午餐”定理仍成立

5.試述機器學習在網際網路搜尋的哪些環節起什麼作用

相關推薦

《機器學習》周志華學習筆記第一章緒論（課後習題）

緒論：