決策樹之分類樹和迴歸樹

本文主要講解最常用的3種決策樹（ID、C4.5和CART），為了更加系統和全面的認識這3種常用的決策樹演算法，我將從以下4個部分進行講解：
1.決策樹學習演算法步驟有哪些？
2.常用的決策樹演算法有哪幾種？
3.決策樹剪枝
4.Gini指數與熵的關係

1.決策樹學習演算法步驟有哪些？

決策樹學習演算法通常包括以下3個步驟：

特徵選擇
選取對訓練資料具有分類能力的特徵。
換句話說，特徵選擇是決定用哪個特徵來劃分特徵空間。
特徵選擇的準則有資訊增益（ID3）、資訊增益比（C4.5）和基尼指數（CART中的分類樹）。
樹的生成
決策樹包括分類樹和迴歸樹。生成分類樹的方法有ID3，C4.5和CART分類樹，分別使用資訊增益，資訊增益比和基尼指數；生成迴歸樹的方法有CART迴歸樹，使用了最小二乘法（尋找最優切分變數與切分點）。

樹的剪枝
主要分為樹的剪枝演算法和CART剪枝演算法

2.常用的決策樹演算法介紹

決策樹演算法	特徵選擇準則
ID3	資訊增益
C4.5	資訊增益比
CART(迴歸樹）	最小二乘法
CART（分類樹）	基尼指數

下面將對以上決策樹演算法進行詳細講解

1）ID3演算法
ID3演算法的核心是在決策樹各個結點上應用資訊增益準則選擇特徵，遞迴地構建決策樹。具體方法

為：從根結點開始，對結點計算所有可能的特徵的資訊增益，選擇資訊增益最大的特徵作為結點的特徵，由該特徵的不同取值建立子結點；再對子結點遞迴地呼叫以上方法，構建決策樹；直到所有特徵的資訊增益均很小或沒有特徵可以選擇為止。
資訊增益計算的公式為：
$g(D,A) = H(D)-H(D|A)$
$H(D)=$ $\sum_1^n\frac{|Ci|}{|D|}$ $log_2(\frac{|Ci|}{|D|})$ ,k為類別數， $|Ci|$ 表示屬於類i的樣本個數， $|D|$ 表示整個資料集的樣本個數。
$H(D|A)=$ $\sum_1^n\frac{|Di|}{|D|}$ $H(Di)=$ $-\sum_1^n\frac{|Di|}{|D|}$ $\sum_1^k\frac{|Dik|}{|Di|}$ $log_2(\frac{|Dik|}{|Di|})$ ，其中，n表示D被特徵A劃分的個數, $Dik$ 表示 $Di$ 中屬於類k的樣本個數。

資訊增益 $g(D,A)$ 表示由於特徵A而使得對資料集D的分類的不確定性減少的程度。顯然，對於資料集D而言，資訊增益依賴於特徵，不同的特徵往往具有不同的資訊增益。資訊增益大的特徵具有更強的分類能力。

==ID3演算法==
輸入：訓練資料集D，特徵A，閾值ε
輸出：決策樹T
(1)若D中所有例項屬於同一類Ck，則T為單結點樹，並將類Ck作為該結點的類標記，返回T；
(2)若A=∅，則T為單結點樹，並將D中例項數最大的類Ck作為該結點的類標記，返回T；
(3)否則，按照資訊增益公式計算A中各特徵對D的資訊增益，選擇資訊增益最大的特徵Ag；
(4)如果Ag的資訊增益小於閾值ε，則置T為單結點樹，並將D中例項數最大的類Ck作為該結點的類標記，返回T；
(5)否則，對Ag中每一可能值ai，依Ag=ai將D分隔為若干非空子集Di，將Di中例項數最大的類作為標記，構建子結點，由結點及其子結點構成樹T，返回T；
(6)對第i個子結點，以Di為訓練集，以A-{Ag}為特徵集，遞迴地呼叫步(1)~(5)，得到子樹Ti，返回Ti。

2）C4.5演算法
C4.5演算法在ID3演算法的基礎上進行了改進，具體表現為在生成樹的過程中使用了資訊增益比，改進了ID3使用資訊增益容易產生過擬合的缺點。
特徵A對訓練資料集D的資訊增益比 $g_R(D,A)$ 定義為其資訊增益 $g(D,A)$ 與訓練資料集D關於特徵A的值的熵 $H_A(D)$ 之比，即：
$g(D,A)=\frac{g(D,A)}{H_A(D)}$
其中， $H_A(D)=$ $\sum_1^n\frac{|Di|}{|D|}$ $log_2\frac{|Di|}{|D|}$ ，n是特徵A取值的個數。

C4.5生成演算法
輸入：訓練資料集D，特徵集A，閾值ε
輸出：決策樹T
(1)若D中所有例項屬於同一類Ck，則T為單結點樹，並將類Ck作為該結點的類標記，返回T；
(2)若A=∅，則T為單結點樹，並將D中例項數最大的類Ck作為該結點的類標記，返回T；
(3)否則，按照資訊增益比公式計算A中各特徵對D的資訊增益比，選擇資訊增益比最大的特徵Ag；
(4)如果Ag的資訊增益比小於閾值ε，則置T為單結點樹，並將D中例項數最大的類Ck作為該結點的類標記，返回T；
(5)否則，對Ag中每一可能值ai，依Ag=ai將D分隔為若干非空子集Di，將Di中例項數最大的類作為標記，構建子結點，由結點及其子結點構成樹T，返回T；
(6)對第i個子結點，以Di為訓練集，以A-{Ag}為特徵集，遞迴地呼叫步(1)~(5)，得到子樹Ti，返回Ti。

秦剛剛的機器學習成長之路之決策樹總結

決策樹之分類樹和迴歸樹

1.決策樹學習演算法步驟有哪些？

2.常用的決策樹演算法介紹

機器學習之路: python 決策樹分類預測泰坦尼克號乘客是否幸存

機器學習入門 - 1. 介紹與決策樹(decision tree)

《機器學習》第三章決策樹學習筆記加總結

機器學習二——分類算法--決策樹DecisionTree

機器學習--DIY筆記與感悟--②決策樹（1）

機器學習實戰（二）決策樹DT（Decision Tree、ID3演算法）

機器學習實戰讀書筆記(2)--決策樹

機器學習筆記（參考吳恩達機器學習視訊筆記）16_決策樹

小白自學機器學習之一文讀懂決策樹演算法詳解

機器學習實戰（2）-決策樹

機器學習實戰程式碼_Python3.6_決策樹_程式碼

機器學習與深度學習系列連載：第一部分機器學習（十一）決策樹2（Decision Tree）

機器學習入門（六）決策樹

機器學習-10（最優決策樹演算法的實際展示）

機器學習實戰(第三篇)-決策樹簡介

機器學習實戰(第三篇)-決策樹構造

機器學習筆記（四）——決策樹如何長成森林？

【機器學習演算法-python實現】決策樹-Decision tree（1）資訊熵劃分資料集

機器學習筆記（六）決策樹

機器學習演算法（二）——決策樹分類演算法及R語言實現方法