1. 程式人生 > >ID3演算法 改進的C4.5演算法 決策樹演算法

ID3演算法 改進的C4.5演算法 決策樹演算法

最早的決策時演算法是由

Hunt

等人於

1966

年提出的

CLS

。當前最有影

響的決策樹演算法是

Quinlan

1986

年提出的

ID3

1993

年提出的

C4.5

ID3

只能處理離散型描述屬性,它選擇資訊增益最大的屬性劃分訓練樣本,

其目的是進行分枝時系統的熵最小,從而提高演算法的運算速度和精確度。

ID3

演算法的主要缺陷是,用資訊增益作為選擇分枝屬性的標準時,偏向於取

值較多的屬性,而在某些情況下,這類屬性可能不會提供太多有價值的信

息。

C4.5

ID3

演算法的改進演算法,不僅可以處理離散型描述屬性,還能處

理連續性描述屬性。

C4.5

採用了資訊增益比作為選擇分枝屬性的標準,彌

補了

ID3

演算法的不足。

最早的決策時演算法是由

Hunt

等人於

1966

年提出的

CLS

。當前最有影

響的決策樹演算法是

Quinlan

1986

年提出的

ID3

1993

年提出的

C4.5

ID3

只能處理離散型描述屬性,它選擇資訊增益最大的屬性劃分訓練樣本,

其目的是進行分枝時系統的熵最小,從而提高演算法的運算速度和精確度。

ID3

演算法的主要缺陷是,用資訊增益作為選擇分枝屬性的標準時,偏向於取

值較多的屬性,而在某些情況下,這類屬性可能不會提供太多有價值的信

息。

C4.5

ID3

演算法的改進演算法,不僅可以處理離散型描述屬性,還能處

理連續性描述屬性。

C4.5

採用了資訊增益比作為選擇分枝屬性的標準,彌

補了

ID3

演算法的不足。

最早的決策時演算法是由Hunt等人於1966年提出的CLS。當前最有影響的決策樹演算法是Quinlan於1986年提出的ID3和1993年提出的C4.5。