1. 程式人生 > >決策樹演算法實現要點

決策樹演算法實現要點

1.定義節點(節點的集合形成樹);即定義一個結構體Point,而 用Point tree[] 來表示樹。
點Point裡面包括name(在該點進行分類的特徵),val(該點父輩的特徵的某個值),n_child(帶點子代的數量),*son(指向子代的指標),id(帶節點是否有必要存在)
2.全域性變數:總資料條數m,總特徵數n,總節點數tot,總根節點數root,所有資料的資料集dataset,所有的特徵名Cha_name,
3.一些重要的函式:判斷輸入資料集是否同類;取輸入資料集中的較多的一類;計算給定的資料集和對應的資訊熵;計算給定的特徵的資訊熵增益;取最大熵增益對應的特徵;根據輸入的特徵對資料集進行劃分;獲得某個屬性的所有的可能值;種樹函式,即形成Point tree[],並展示出來。