機器學習筆記10-梯度提升樹（GBDT）

阿新 • • 發佈：2019-01-03

機器學習筆記10-梯度提升樹（GBDT）

在上一節中講到了整合學習的Boosting方法，並詳細解釋了其中的代表性演算法AdaBoost演算法。除了AdaBoost演算法外，Boosting中還有另一個非常常用的演算法：提升樹和梯度提升樹（GBDT）。

提升樹
提升樹是以分類樹或迴歸樹為基本分類器的提升方法，可以表示為加法模型： $f_{M}$

( x ) = ∑ m = 1

M T ( x ; θ m

) {f_M}(x) = \sum\limits_{m = 1}^M {T(x;{\theta _m})} $f_{M} (x) = m = 1 \sum M T (x; θ_{m})$ ，其中 ${T(x;{\theta _m})}$ 表示決策樹， $\theta _m$ 表示決策樹的引數，M為決策樹的個數。提升樹演算法採用前向分步演算法。首先確定 $f_0(x)=0$ ，第m步的模型是
${f_m}(x) = {f_{m - 1}}(x) + T(x;{\theta _m})$ 其中， $f_{m-1}(x)$ 為當前模型，通過極小化損失函式確定下一棵決策樹的引數 $\theta_m$
${{\hat \theta }_m} = \arg {\rm{ }}\mathop {{\rm{min}}}\limits_{{\theta _m}} \sum\limits_{i = 1}^N {L({y_i},{f_{m - 1}}({x_i}) + T({x_i};{\theta _m}))}$ 針對不同問題的提升樹學習演算法，其主要區別在於使用的損失函式不同。包括用平方誤差損失函式的迴歸問題，用指數損失函式的分類問題，以及用一般損失函式的一般決策問題。對於二類分類問題，提升樹演算法只需要將上一節中的AdaBoost演算法中的基分類器限制為二類分類樹。以下敘述迴歸問題的提升樹：
此時損失函式為：
$L(y,{f_{m - 1}}(x) + T(x;{\theta _m})) = {(y - {f_{m - 1}}(x) - T(x;{\theta _m}))^2} = {(r - T(x;{\theta _m}))^2}$ 這裡 $r=y-f_{m-1}(x)$ ，是當前模型擬合數據的殘差。具體地，其演算法可表述為：
（1）初始化 $f_0(x)=0$ ；
（2）對 $m=1,2,...,M$ ，
（i）計算殘差 $r_{mi}=y_i-f_{m-1}(x)$ ；
（ii）擬合殘差 $r_{mi}$ 學習一個迴歸樹，得到 $T(x; {\theta}_m)$ ，這一步可參考決策樹那一節；
（iii）更新 ${f_m}(x) = {f_{m - 1}}(x) + T(x;{\theta _m})$
（3）得到迴歸樹模型 ${f_M}(x) = \sum\limits_{m = 1}^M {T(x;{\theta _m})}$ 。
梯度提升樹（GBDT）
提升樹當損失函式是平方損失或指數損失函式時，每一步優化都很簡單。但對於一般損失函式是，每一步優化都不容易。利用梯度提升樹可以解決這個問題。它利用了最速下降法的近似方法，其關鍵是利用損失函式的負梯度在當前模型的值
$- {[\frac{\partial L (y, f (x_{i}))}{\partial f (x_{i})}]}_{f (x) = f_{m - 1}}$

機器學習筆記10-梯度提升樹（GBDT）

機器學習筆記10-梯度提升樹（GBDT）在上一節中講到了整合學習的Boosting方法，並詳細解釋了其中的代表性演算法AdaBoost演算法。除了AdaBoost演算法外，Boosting中還有另一個非常常用的演算法：提升樹和梯度提升樹（GBDT）。提升樹提升樹是以分

機器學習sklearn19.0——整合學習——boosting與梯度提升演算法（GBDT）、Adaboost演算法

一、boosting演算法原理二、梯度提升演算法關於提升梯度演算法的詳細介紹，參照部落格：http://www.cnblogs.com/pinard/p/6140514.html 對該演算法的sklearn的類庫介紹和調參，參照網址：http://

梯度提升樹（GBDT）理解

GBDT是整合學習方法Boosting中的一種，所以其中每個弱分類器都有先後順序，同時每個弱分類器都有其的權重。 GBDT的思想在GBDT的迭代過程中，假如前一輪迭代得到的強分類器是 Fm−1(x) F

【R機器學習筆記】梯度提升迴歸樹——gbm包

gbm包 gbm包是梯度提升迴歸樹（GBRT）在R 中的實現。GBRT，全稱為Gradient Boosting Regression Tree, 有時也稱為GBDT。 wiki中對GBRT的定義 Gradient boosting is a

【機器學習演算法】：提升樹（Boosting tree）

提升樹是以分類樹和迴歸樹為基本分類器的提升方法。提升樹被認為是統計學習中效能最好的方法之一。Boosting方法其實本質上採用的是加法模型（基函式的線性組合）與前向分佈演算法。以決策樹為基函式的Boosting方法被稱為提升樹（Boosting tree）。對分

機器學習boosting演算法—梯度提升樹(GBDT)

1 迴歸樹演算法分析 Adaboost演算法是提升樹的特殊情況，主要用於分類問題，對於迴歸問題怎麼處理呢？？已知一個訓練資料集T={(x1,y1),(x2,y2),...,(xN,yN)},假設輸入空間為χ,如果將輸入空間劃分為J個互不相交的區域R1,R2

吳恩達機器學習筆記10-梯度下降法實踐1-特征縮放

alt style span 技術分享嘗試最簡學習梯度下降法實踐　　在我們面對多維特征問題的時候，我們要保證這些特征都具有相近的尺度，這將幫助梯度下降算法更快地收斂。　　以房價問題為例，假設我們使用兩個特征，房屋的尺寸和房間的數量，尺寸的值為 0-2000 平方

GBDT梯度提升樹（一）

提升樹（例項）已知訓練資料如上表所示，x的取值範圍為區間[0.5,10.5]，y的取值範圍為區間[5.0,10.0]，學習這個迴歸問題的提升樹模型，考慮只用樹樁作為基函式。解既然是一個提升樹,

機器學習實戰——1.2決策樹（2）

宣告：參考書目《機器學習實戰》作者: Peter Harrington 出版社: 人民郵電出版社譯者: 李銳 / 李鵬 / 曲亞東 / 王斌宣告：參考書目《統計學習方法》作者: 李航出版社: 清華大學出版社 ISBN: 9787302275954

機器學習實戰——1.2決策樹（1）

Andrew Ng機器學習筆記+Weka相關演算法實現（三）神經網路和引數含義

神經網路是一種非常重要的機器學習模型，人們從生物學中大腦神經元連線方式得到啟發，提出了神經網路的概念，它從資訊處理角度對人腦神經元網路進行抽象，建立某種簡單模型，按不同的連線方式組成不同的網路。最近幾年深度學習大熱,尤其是阿爾法圍棋（AlphaGo）戰勝李

機器學習筆記——基於奇異值分解（SVD）的影象壓縮（PIL）

此指令碼的作用是圖片壓縮（清晰度尚可的情況下，可達到8倍以上的壓縮比），是SVD的一個應用實踐，涉及PIL、numpy庫。（python中處理圖片的庫比較多，比如PIL、OpenCV、matplot

記一下機器學習筆記最小均方（LMS）演算法

這裡是《神經網路與機器學習》第三章的筆記… 最小均方演算法，即Least-Mean-Square，LMS。其提出受到感知機的啟發，用的跟感知機一樣的線性組合器。在意義上一方面LMS曾被用在了濾波器上，另一方面對於LMS的各種最優化方式為反向傳播演算法提供了

Andrew Ng機器學習筆記+Weka相關演算法實現（四）SVM和原始對偶問題

這篇部落格主要講解了Ng的課第六、七個視訊，涉及到的內容包括，函式間隔和幾何間隔、最優間隔分類器（ Optimal Margin Classifier）、原始/對偶問題（ Primal/Dual Problem）、 SVM 的對偶問題幾個部分。函式間

Oracle 學習筆記10 —— 邏輯控制2（迴圈）

1、loop ... end looploop 迴圈是最基本的迴圈，也稱為無條件迴圈。在這種型別的迴圈中如果沒有指定exit字句，將出現死迴圈。所以在loop迴圈中必須指定exit語句。loop 迴圈的語法格式如下: loop statements; exit wh

Python機器學習筆記：線性判別分析（LDA）演算法

預備知識　　首先學習兩個概念：　　線性分類：指存在一個線性方程可以把待分類資料分開，或者說用一個超平面能將正負樣本區分開，表示式為y=wx，這裡先說一下超平面，對於二維的情況，可以理解為一條直線，如一次函式。它的分類演算法是基於一個線性的預測函式，決策的邊界是平的，比如直線和平面。一般的方法有感知器，最小

Python機器學習筆記：奇異值分解（SVD）演算法

完整程式碼及其資料，請移步小編的GitHub 　　傳送門：請點選我　　如果點選有誤：https://github.com/LeBron-Jian/MachineLearningNote 　　奇異值分解（Singular Value Decomposition，後面簡稱 SVD）是線上性代數中一種

機器學習--DIY筆記與感悟--②決策樹（1）

lis ... 編寫代碼需要總結初始化對數三分 xtend 在完成了K臨近之後，今天我們開始下一個算法--->決策樹算法。一、決策樹基礎知識如果突然問你"有一個陌生人叫X,Ta今天需要帶傘嗎?", 你一定會覺得這個問題就像告訴你"兩千米外有一個超市,

機器學習 - 提升樹（下）- XGBoost 以及與 GBDT 的比較

機器學習 - 提升樹（下）- XGBoost 以及與 GBDT 的比較 XGBoost（eXtreme Gradient Boost）原理預剪枝與 GBDT 的比較

機器學習 - 提升樹（上）- BT、GBDT

機器學習 - 提升樹（上）- BT、GBDT BT（Boosting Tree）介紹原理演算法過程舉例 GBDT（Gradient Boosting De

機器學習筆記10-梯度提升樹（GBDT）

機器學習筆記10-梯度提升樹（GBDT）

相關推薦