1. 程式人生 > >《機器學習》 周志華學習筆記第七章 貝葉斯分類器(課後習題)python 實現

《機器學習》 周志華學習筆記第七章 貝葉斯分類器(課後習題)python 實現

課後習題答案

1.試用極大似然法估算西瓜集3.0中前3個屬性的類條件概率。

好瓜有8個,壞瓜有9個

屬性色澤,根蒂,敲聲,因為是離散屬性,根據公式(7.17)

P(色澤=青綠|好瓜=是) = 3/8

P(色澤=烏黑|好瓜=是) = 4/8

P(色澤=淺白|好瓜=是) = 1/8

P(根蒂=蜷縮|好瓜=是) = 5/8

P(根蒂=稍蜷|好瓜=是) = 3/8

。。。自己計算

另外看到這種,假定概率分佈在連續屬性上,離散屬性直接進行上邊的計算也可以

極大似然法要先假定一種概率分佈形式。 
色澤: 
對於好瓜,假設 
P(色澤=青綠|好瓜)=σ1σ1 
P(色澤=烏黑|好瓜)=σ2σ2 
P(色澤=淺白|好瓜)=σ3σ3=1−σ1−σ21−σ1−σ2 
L(σ)=⋂iP(色澤=xi|好瓜)=σ31σ42(1−σ1−σ2)L(σ)=⋂iP(色澤=xi|好瓜)=σ13σ24(1−σ1−σ2) 
L′(σ1)=σ42σ21(3−4σ1−3σ2)L′(σ1)=σ24σ12(3−4σ1−3σ2) 
L′(σ2)=σ31σ32(4−4σ1−5σ2)L′(σ2)=σ13σ23(4−4σ1−5σ2) 
令L′(σ1)=0,L′(σ2)=0′(σ1)=0,L′(σ2)=0得σ1=38σ1=38,σ1=12σ1=12,σ3=18σ3=18 
可以看出σ1,σ2,σ3σ1,σ2,σ3分別對應他們在yangben中出現的頻率。

2.試證明:條件獨立性假設不成立時,樸素貝葉斯分類器任有可能產生最優分類器。

樸素貝葉斯分類器就是建立在條件獨立性假設上的。當有不獨立的屬性時,假如所有yangben不獨立的屬性取值相同時分類也是相同的,那麼此時樸素貝葉斯分類器也將產生最優分類器。

3.試程式設計實現拉普拉斯修正的樸素貝葉斯分類器,並以西瓜資料集3.0為訓練集,並對“測1”進行分類。

python程式碼

https://github.com/makang101/machinelearning

4.試述防止下溢的可能方案。

對乘積取自然對數。採取自然對數進行處理不會有任何的損失,兩條曲線增區間和減區間相同,並且在相同點上取得極值。

6.試程式設計實現AODE分類器,並以西瓜資料集3.0為訓練集,並對“測1”進行分類。

簡單起見 沒有考慮連續屬性。可按書中公式編寫程式。python 程式碼實現

https://github.com/makang101/machinelearning/blob/master/chapter7bayesian/AODE.ipynb