1. 程式人生 > >李航統計學習方法習題5.1

李航統計學習方法習題5.1

定義5.3(資訊增益比)特徵A對訓練資料集D的資訊增益比定義為其資訊增益與訓練資料集D關於特徵A的值的熵之比,即

                                                                                                                 

其中,,n是特徵A的取值個數。(書本原定義)

習題5.1:根據表5.2所表示的訓練資料集,利用資訊增益比(C4.5演算法)生成決策樹。

由題意知:


由於的資訊增益比最大,所以選擇特徵作為根節點的特徵,得到

                                                                                        

 D1只有同一類的樣本點。

對於D2再計算資訊增益比得


選擇特徵A2作為D2的根節點

                                                                                                  

該決策樹只用了兩個特徵!與書本的例題相一致。