ID3演算法 改進的C4.5演算法 決策樹演算法
阿新 • • 發佈:2019-02-04
最早的決策時演算法是由
Hunt
等人於
1966
年提出的
CLS
。當前最有影
響的決策樹演算法是
Quinlan
於
1986
年提出的
ID3
和
1993
年提出的
C4.5
。
ID3
只能處理離散型描述屬性,它選擇資訊增益最大的屬性劃分訓練樣本,
其目的是進行分枝時系統的熵最小,從而提高演算法的運算速度和精確度。
ID3
演算法的主要缺陷是,用資訊增益作為選擇分枝屬性的標準時,偏向於取
值較多的屬性,而在某些情況下,這類屬性可能不會提供太多有價值的信
息。
C4.5
是
ID3
演算法的改進演算法,不僅可以處理離散型描述屬性,還能處
理連續性描述屬性。
C4.5
採用了資訊增益比作為選擇分枝屬性的標準,彌
補了
ID3
演算法的不足。
最早的決策時演算法是由
Hunt
等人於
1966
年提出的
CLS
。當前最有影
響的決策樹演算法是
Quinlan
於
1986
年提出的
ID3
和
1993
年提出的
C4.5
。
ID3
只能處理離散型描述屬性,它選擇資訊增益最大的屬性劃分訓練樣本,
其目的是進行分枝時系統的熵最小,從而提高演算法的運算速度和精確度。
ID3
演算法的主要缺陷是,用資訊增益作為選擇分枝屬性的標準時,偏向於取
值較多的屬性,而在某些情況下,這類屬性可能不會提供太多有價值的信
息。
C4.5
是
ID3
演算法的改進演算法,不僅可以處理離散型描述屬性,還能處
理連續性描述屬性。
C4.5
採用了資訊增益比作為選擇分枝屬性的標準,彌
補了
ID3
演算法的不足。
最早的決策時演算法是由Hunt等人於1966年提出的CLS。當前最有影響的決策樹演算法是Quinlan於1986年提出的ID3和1993年提出的C4.5。