【機器學習模型詳細推導4】-決策樹

阿新 • • 發佈：2018-11-26

決策樹

一. 決策樹介紹
二. ID3/C4.5
三. CART演算法

1、最小二乘迴歸樹生成演算法
2、CART分類樹
3、CART剪枝

一. 決策樹介紹

模型： 一個樹形的判斷結構，內部結點表示特徵或屬性，葉子節點表示一個分類

如何學習一個決策樹：

特徵選擇
樹的生成
決策樹剪枝

實現演算法： ID3、C4.5、CART

二. ID3/C4.5

0）熵：描述資料集合不確定性的方法
$熵$

： H ( D ) = − ∑ i

= 1 n p i l o g

p i 其中， n 為類別數熵：H(D) = -\sum _{i=1}^n p_ilogp_i \\ 其中，n為類別數

熵 ： H (D) = - i = 1 \sum n p_{i} l o g p_{i} 其 中 ， n 為 類 別 數

1）特徵選擇：

對每一個特徵進行計算，優先選擇資訊增益/資訊增益率大的特徵。

資訊增益（ID3演算法採用）
特徵A對訓練資料集D的資訊增益：
$\begin{aligned} g(D,A) &=H(D)-H(D|A)\\ &=-\sum_{k=1}^K \frac{|C_k|}{|D|}log_2{\frac{|C_k|}{|D|}}-\sum_{i=1}^n \frac{|D_i|}{|D|}H(D_i)\\ &=-\sum_{k=1}^K \frac{|C_k|}{|D|}log_2{\frac{|C_k|}{|D|}}-(-\sum_{i=1}^n \frac{|D_i|}{|D|}\sum_{k=1}^K \frac{|D_{ik}|}{|D_i|}log_2{\frac{|D_{ik}|}{|D_i|}}) \end{aligned}$ 其中，k代表標籤類別，n表示D被A劃分的類別。
資訊增益率（C4.5採用）
$g_R(D,A)=\frac{g(D,A)}{H_A(D)}$ 其中， $H_A(D)$ 表示特徵變數本身的複雜程度，代表資料集D被A特徵劃分的熵，而不是按照標籤類別劃分的熵

（Q1：資訊增益率對比資訊增益的好處？）
因為資訊增益偏向於選擇取值較多的特徵（例如編號、日期這種特徵取值很多但沒意義），容易過擬合。需要一個對特徵變數本身複雜度的懲罰項，所以就有了資訊增益率。

2）決策樹生成

【1】選擇資訊增益/資訊增益率最大的特徵作為數節點的判斷特徵
【2】由選定特徵的不同取值建立子結點
【3】子結點遞迴選擇特徵，構建決策樹
【4】直到所有特徵的 $g(D,A)$ 都很小或沒有特徵

3）決策樹剪枝

在決策樹生成之後，利用樹整體的損失函式進行剪枝
樹T的損失函式：
$C_\alpha(T) = C(T) + \alpha|T|$ 其中， $C(T)$ 表示預測誤差，用經驗熵來計算； $|T|$ 表示葉子節點數，即模型複雜度；引數 $\alpha$ 控制兩者之間的影響，剪枝的核心也就在 $\alpha$ 了， $\alpha$ 可以控制樹的大小。

葉子節點t上的經驗熵：
$H_t(T)=-\sum_k\frac{N_{tk}}{N_t}log\frac{N_{tk}}{N_t}$

【機器學習模型詳細推導4】-決策樹

決策樹一. 決策樹介紹二. ID3/C4.5 三. CART演算法 1、最小二乘迴歸樹生成演算法 2、CART分類樹 3、CART剪枝一. 決策樹介紹模型：一個樹形的判斷結構，內部結

【機器學習模型詳細推導2】- 邏輯迴歸

邏輯迴歸 1. 模型引入 2. 模型描述 3. 模型求解策略（代價函式） 4. 模型求解演算法 - 梯度下降 1. 模型引入線性模型可以進行迴歸學習（參見【機器學習模型1】- 線性迴歸），但如何用於分類任務？需要找一個單調可

【機器學習模型】整合學習總結

整合學習一. 同質整合 1. Boosting 2. Bagging 3. Stacking 二. 異質整合 1. 平均法 2. 投票法 3. 學習法（Stacking）

【ML模型詳細推導3】- 感知機

感知機 1. 一句話介紹感知機 2. 模型介紹（原始形式） 3. 感知機的對偶形式 1. 一句話介紹感知機 · 一個二分類的線性分類模型。 · 感知機學習旨在求出將訓練集資料進行線性劃分的分類超平面，匯入基於誤分類的損失函式，利用梯

【ML模型詳細推導1】- 線性迴歸

線性迴歸 0. 資料集和目標 1. 模型 2. 策略 3. 演算法(模型求解) 3.1 正規方程法 3.2 梯度下降法 4. 廣義線性模型學習過程主要順著周志華《機器學習》第三章線性模型

【機器學習算法-python實現】PCA 主成分分析、降維

pre gre text iss 主成分分析 int 找到 nts 導入 1.背景 PCA(Principal Component Analysis)，PAC的作用主要是減少數據集的維度，然後挑選出基本的特征。 PCA的主要思想是移動坐標軸，找

【機器學習PAI實踐十二】機器學習演算法基於信用卡消費記錄做信用評分

背景如果你是做網際網路金融的，那麼一定聽說過評分卡。評分卡是信用風險評估領域常用的建模方法，評分卡並不簡單對應於某一種機器學習演算法，而是一種通用的建模框架，將原始資料通過分箱後進行特徵工程變換，繼而應用於線性模型進行建模的一種方法。評分卡建模理論常

【機器學習實戰-kNN(k-近鄰)】python3實現-書本知識【1】

說明：本文內容為【Peter Harrington -機器學習實戰】一書的學習總結筆記。基本概念： kNN是聚類演算法中一種使用歐式定理計算各個特徵之間的距離而進行分類的基礎演算法，歐式定理：

【機器學習算法-python實現】svm支持向量機(3)—核函數

【機器學習算法-python實現】掃黃神器-樸素貝葉斯分類器的實現

《深度實踐Spark機器學習》第11章 pyspark決策樹模型

由於此書不配程式碼，以下程式碼都是本寶寶在ipynb測試過的，執行環境為hdp2.6.2和Anaconda2。完整ipynb和py程式碼地址：https://gitee.com/iscas/deep_spark_ml/tree/master11.3 資料載入刪除標題sed 1

機器學習讀書筆記（三）決策樹基礎篇之從相親說起

方法事務家裏分類筆記判斷都是 rom tro 一、決策樹決策樹是什麽？決策樹(decision tree)是一種基本的分類與回歸方法。舉個通俗易懂的例子，如下圖所示的流程圖就是一個決策樹，長方形代表判斷模塊(decision block)，橢圓形成代

《機器學習實戰》中用matplotlib繪製決策樹, python3

人笨, 繪製樹形圖那裡的程式碼看了幾次也沒看懂(很多莫名其妙的(全域性?)變數), 然後就自己想辦法寫了個 import matplotlib.pyplot as plt from matplotlib.font_manager import FontPropertie

機器學習十大經典演算法之決策樹（學習筆記整理）

一、決策樹概述決策樹是一種樹形結構，其中每個內部節點表示一個屬性上的測試，每個分支代表一個測試輸出，每個葉節點代表一種類別。決策樹是一個預測模型，代表的是物件屬性與物件值之間的一種對映關係。最初的節點稱為根節點（如圖中的"顏色"），有分支的節點稱為中間節點

機器學習筆記（三）：決策樹

決策樹（decision tree）是機器學習中最常見的方法之一，本文主要對決策樹的定義，生成與修剪以及經典的決策樹生成演算法進行簡要介紹。目錄如下一、什麼是決策樹二、決策樹的生成三、決策樹的修剪四、一些經典的決策樹生成演算法一、什麼是決策樹顧名

《web安全之機器學習入門》第6章決策樹與隨機森林演算法

決策樹識別pop3埠掃描（原書中識別暴力破解，實際上pop3協議的並沒有guess_passwd型別的資料，所以改為識別port_sweep.）：待分析資料集：KDD-99資料集，連結：http://kdd.ics.uci.edu/databases/kddcup99/kdd

機器學習方法篇(9)------梯度提升決策樹GBDT

● 每週一言生命在於運動，無論腦力還是體力。導語前面第3、4兩節介紹了決策樹，由於決策樹簡單有效，可解釋性強，因此被包裝成了一些更為高效的機器學習演算法，其中最為知名的就是梯度提升決策樹GBDT（Gradient Boosting Decisio

機器學習：結點的實現，決策樹程式碼實現（二）

文章目錄楔子定義變數：定義方法獲得劃分的feature 生成結點停止條件及其處理 fit() 生成樹剪枝楔子前面已經實現了各種資訊量的計算，那麼我們劃分的基本有了，那

機器學習與人工智障(5):決策樹與隨機森林

一、從LR到決策樹　　1.總體流程與核心問題　　　　(1)決策樹是基於樹的結構進行決策：　　　　　　每個“內部節點”對應於某個屬性上的“測試” 　　　　　　每個分支對應於該測試的一種可能結果(即該屬性上的每個取值) 　　　　　　每個葉節點對應於一個預測結果　　　　(2)學習過程：通過對訓練

機器學習筆記：ID3演算法建立決策樹(一)

ID3演算法的核心思想以資訊熵的下降速度作為選取測試屬性的標準，所選的測試屬性是從根節點到當前節點的路徑上尚未被考慮的具有最高資訊增益的屬性。維基百科上對ID3演算法有比較詳細的介紹：ID3維基

【機器學習模型詳細推導4】-決策樹

決策樹

一. 決策樹介紹

二. ID3/C4.5

相關推薦