【讀書筆記】周誌華《機器學習》第三版課後習題討<第一章-緒論>
阿新 • • 發佈:2018-03-04
樣本 聲明 同時 body 集合 不管怎麽說 單個 clas 機器
雖然是緒論。。但是。。。真的有點難!不管怎麽說,一點點前進吧。。。
聲明一下答案不一定正確,僅供參考,為本人的作答,希望大神們能多多指教~
1.1 表1.1中若只包含編號為1和4的兩個樣例,試給出相應的版本空間。
解答:本題考查版本空間、假設空間的概念。簡而言之,假設空間是該問題情景下,所有的取值可能性(包括單屬性泛化、二屬性泛化、X屬性泛化……全泛化的情況),而版本空間則是指在測試用樣本情境下,滿足樣本內所有正例的假設集合(一般版本空間內的假設都是帶有屬性泛化)。
我們先來看一下1和4樣例組成的表,以供接下來探討進行參考:
編號 | 色澤 | 根蒂 | 敲聲 | 好瓜? |
1 | 青綠 | 蜷縮 | 濁響 | 是 |
4 | 烏黑 | 稍蜷 | 沈悶 | 否 |
解題中,要緊扣“我只知道這張表的信息,去推測整體”的思想。根據此表信息,假設空間是(2+1)X(2+1)X(2+1)+1=28種假設,版本空間則應該是假設空間內能確定1是好瓜,同時剛好能排除4是好瓜的所有可能,所以應該是(色澤=青綠)∧(根蒂=蜷縮)∧(敲聲=濁響),以及本例的一個屬性泛化(三種),和兩個屬性泛化(三種),共7種。不可加入三屬性泛化,因為(色澤=*)∧(根蒂=*)∧(敲聲=*),這種情況會把編號4也判定為好瓜,與樣本不符。
1.2 與使用單個合取式來進行假設表示相比,使用“析合範式”將使得假設空間具有更強的表示能力。若使用最多包含K個合取式的析合範式來表達表1.1西瓜分類問題的假設空間,試估算共有多少種可能的假設。
解答:本題考查一些離散數學的知識,同時為後文提示了使假設空間具有更強表示能力的一種編程表達。我們再來看一下表1.1:
編號 | 1 | 2 | 3 | 4 |
色澤 | 青綠 | 烏黑 | 青綠 | 烏黑 |
根蒂 | 蜷縮 | 蜷縮 | 硬挺 | 稍蜷 |
敲聲 | 濁響 | 濁響 | 清脆 | 沈悶 |
好瓜 | 是 | 是 | 否 | 否 |
【讀書筆記】周誌華《機器學習》第三版課後習題討<第一章-緒論>