小白自學機器學習之一文讀懂決策樹演算法詳解
阿新 • • 發佈:2018-11-15
1.概念準備
-
1.1 遞迴與迭代
區別 定義 優缺點 遞迴(recursion) 程式呼叫自身 1.問題大化小,減少程式碼量
2.易造成堆疊溢位,浪費空間迭代(iterate) 利用變數的原值推算出變數的新值 1.效率高,不增加空間開銷
2.不易理解,程式碼不如遞迴簡介 -
資訊理論研究資訊的量化、傳輸、儲存,一個事件中包含的資訊量用自資訊(I(X))來量化。
資訊熵公式
熵的本質是對不確定性的度量,用數學公式表達只與概率p(x)有關,是資訊的期望值。熵值越高,則資料混合的種類越多,其可能的變化越多,攜帶的資訊量也就越大,只與值的種類和各種類發生概率有關。(與具體的值無關)
物理意義是平均編碼長度。
資訊理論中 底數用2,對應單位是 ;機器學習中習慣用 ,對應單位為 ;底數用10,對應單位為 。
通俗理解條件熵。
-
1.4 交叉熵
以上是從資訊理論來理解資訊熵。從**計算機編碼角度(物理含義)**來理解:資訊熵是隨機變數平均編碼的最小長度。資訊熵是完美編碼,交叉熵是不完美編碼,相對熵是兩者差值,差值也稱為差異,即KL散度。
對於一個以 為概率的樣本集X(資訊熵