1. 程式人生 > >【讀書筆記】周誌華《機器學習》第三版課後習題討<第一章-緒論>

【讀書筆記】周誌華《機器學習》第三版課後習題討<第一章-緒論>

樣本 聲明 同時 body 集合 不管怎麽說 單個 clas 機器

雖然是緒論。。但是。。。真的有點難!不管怎麽說,一點點前進吧。。。

聲明一下答案不一定正確,僅供參考,為本人的作答,希望大神們能多多指教~

1.1 表1.1中若只包含編號為1和4的兩個樣例,試給出相應的版本空間。

解答:本題考查版本空間、假設空間的概念。簡而言之,假設空間是該問題情景下,所有的取值可能性(包括單屬性泛化、二屬性泛化、X屬性泛化……全泛化的情況),而版本空間則是指在測試用樣本情境下,滿足樣本內所有正例的假設集合(一般版本空間內的假設都是帶有屬性泛化)。

我們先來看一下1和4樣例組成的表,以供接下來探討進行參考:

編號 色澤 根蒂 敲聲 好瓜?
1 青綠 蜷縮 濁響
4 烏黑 稍蜷 沈悶

解題中,要緊扣“我只知道這張表的信息,去推測整體”的思想。根據此表信息,假設空間是(2+1)X(2+1)X(2+1)+1=28種假設,版本空間則應該是假設空間內能確定1是好瓜,同時剛好能排除4是好瓜的所有可能,所以應該是(色澤=青綠)∧(根蒂=蜷縮)∧(敲聲=濁響),以及本例的一個屬性泛化(三種),和兩個屬性泛化(三種),共7種。不可加入三屬性泛化,因為(色澤=*)∧(根蒂=*)∧(敲聲=*),這種情況會把編號4也判定為好瓜,與樣本不符。

1.2 與使用單個合取式來進行假設表示相比,使用“析合範式”將使得假設空間具有更強的表示能力。若使用最多包含K個合取式的析合範式來表達表1.1西瓜分類問題的假設空間,試估算共有多少種可能的假設。

解答:本題考查一些離散數學的知識,同時為後文提示了使假設空間具有更強表示能力的一種編程表達。我們再來看一下表1.1:

編號 1 2 3 4
色澤 青綠 烏黑 青綠 烏黑
根蒂 蜷縮 蜷縮 硬挺 稍蜷
敲聲 濁響 濁響 清脆 沈悶
好瓜

【讀書筆記】周誌華《機器學習》第三版課後習題討<第一章-緒論>