理解GBDT演算法（二）——基於殘差的版本

阿新 • • 發佈：2019-02-03

GBDT演算法有兩種描述思路，一個是基於殘差的版本，一個是基於梯度gradient的版本。這篇我們先說說基於殘差的版本。

這篇我們再總結一個幾個注意點：

這個版本的核心思路：每個迴歸樹學習前面樹的殘差，並且用shrinkage把學習到的結果大步變小步，不斷迭代學習。其中的代價函式是常見的均方差。
其基本做法就是：先學習一個迴歸樹，然後“真實值-預測值*shrinkage”求此時的殘差，把這個殘差作為目標值，學習下一個迴歸樹，繼續求殘差……直到建立的迴歸樹的數目達到一定要求或者殘差能夠容忍，停止學習。
我們知道，殘差是預測值和目標值的差值，這個版本是把殘差作為全域性最優的絕對方向來學習。

這個版本更加適用於迴歸問題，線性和非線性的均可，而且在設定了閾值之後還可以有分類的功能。
當時該版本使用殘差，很難處理純迴歸以外的問題。版本二中使用梯度，只要建立的代價函式能夠求導，那麼就可以使用版本二的GBDT演算法，例如LambdaMART學習排序演算法。
Shrinkage和梯度下降法中學習步長alpha的關係。shrinkage設小了只會讓學習更慢，設大了就等於沒設，它適用於所有增量迭代求解問題；而Gradient的步長設小了容易陷入區域性最優點，設大了容易不收斂。它僅用於用梯度下降求解。這兩者其實沒太大關係。

理解GBDT演算法（二）——基於殘差的版本

GBDT演算法有兩種描述思路，一個是基於殘差的版本，一個是基於梯度gradient的版本。這篇我們先說說基於殘差的版本。這篇我們再總結一個幾個注意點：這個版本的核心思路：每個迴歸樹學習前面樹的殘差，並且用shrinkage把學習到的結果大步變小步，

理解GBDT演算法（三）——基於梯度的版本

上一篇中我們講到了GBDT演算法的第一個版本，是基於殘差的學習思路。今天來說第二個版本，可以說這個版本的比較複雜，涉及到一些推導和矩陣論知識。但是，我們今天可以看到，兩個版本之間的聯絡，這個是學習演算法的一個重要步驟。這篇博文主要從下面這幾個方面來說基於梯度

連通域標記演算法（二）基於深度優先搜尋的連通域標記演算法（opencv C++實現）

上一篇我們講到了MATLAB中的bwlabel連通域標記演算法的C++實現https://blog.csdn.net/Dhane/article/details/81633723，今天我來講一講另一種相對比較容易想到的連通域標記演算法。簡單點說

深入理解線性模型（二）---基於似然函式的估計

目錄 1. 引言 2. 關於\(\varepsilon\)假設 3. 基於似然函式的估計 3.1 基於假設1 3.2 基於假設2 3.3. 基於假設3

深入理解線性迴歸演算法（二）：正則項的詳細分析

前言當模型的複雜度達到一定程度時，則模型處於過擬合狀態，類似這種意思相信大家看到個很多次了，本文首先討論了怎麼去理解複雜度這一概念，然後回顧貝葉斯思想（原諒我有點囉嗦），並從貝葉斯的角度去理解正則項的含義以及正則項降低模型複雜度的方法，最後總結全文。 &nb

移動推薦演算法（二）：基於簡單規則的預測

本文為轉載文章，來源為： https://blog.csdn.net/Snoopy_Yuan/article/details/72850601 一直在探索資料探勘、資料建模的案例，百度搜到這篇文章，收穫頗豐，轉載以作記錄。前言：移動推薦演算法是阿里天池賽2015年賽題之

【轉】深入淺出理解決策樹演算法（二）-ID3演算法與C4.5演算法

從深入淺出理解決策樹演算法（一）-核心思想 - 知乎專欄文章中，我們已經知道了決策樹最基本也是最核心的思想。那就是其實決策樹就是可以看做一個if-then規則的集合。我們從決策樹的根結點到每一個都葉結點構建一條規則。並且我們將要預測的例項都可以被一條路徑或者一條規則所覆蓋。如下例：假設我

演算法與資料結構（二）基於連結串列的佇列

基於連結串列的佇列一個數據的集合如果以連結串列來儲存，那麼它的容量就是無限的。實現的過程中，需要注意連結串列為空的情況下，需要對頭引用和尾引用做特殊處理。實現程式碼 /** * Created by 18855127160 on 2

兩種開源聊天機器人的性能測試（二）——基於tensorflow的chatbot

drive 找到環境配置 gpu版本 hat dict 終端開源 fontsize http://blog.csdn.net/hfutdog/article/details/78155676 開源項目鏈接：https://github.com/dennybritz/c

linux web服務器（二）基於域名，ip，端口的web虛擬主機

田峰 IT linux linux web服務器（二） 1 ：搭建基於域名的虛擬主機首先為兩個網站搭建dns服務器，並新建區域，分別為：www.goole.co

Mybatis（二）基於註解的入門實例

調用 getc val void pass 搭建 for erb date 前言上一篇簡單的介紹了Mybatis的概念和基於XML來實現數據庫的CRUD，這篇給大家實現基於註解的CRUD。一、初始搭建在基於註解當中前四步和上一篇基於XML是一樣的，分別是： 1）創建數

資料結構與演算法（二）--遞迴

遞迴條件： 1.遞迴條件：每次調自己，然後記錄當時的狀態 2.基準條件：執行到什麼時候結束遞迴，不然遞迴就會無休止的呼叫自己，遞迴的資料結構：棧（先進先出）和彈夾原理一樣，每一次呼叫自己都記錄了當時的一種狀態，然後把這種狀態的結果返回。棧相對應的資料結構：佇列（先進後出

（二）基於SSM+Redis+Nginx+FastDFS的部落格網站

上一篇簡單介紹了該網站的所用的框架、技術之類，這篇就開始講搭建過程。本篇為配置檔案。其中redis和fastdfs的後續用到時再寫。一、搭建基礎框架SSM之配置檔案 maven工程的pom.xml，基

演算法（二）之排序

排序演算法很多，常用的排序演算法有：氣泡排序、插入排序、選擇排序、歸併排序、快速排序、計數排序、基數排序、桶排序。接下來一一介紹幾種排序的時間複雜度及優缺點。插入排序與氣泡排序的時間複雜度相同O(n^2)，開發中我們更傾向插入排序，而不是氣泡排序排序演算法執行效率： 1.最好、最壞、平均情況時間

圖——基本的圖演算法（二）圖的遍歷

圖——基本的圖演算法（二）圖的遍歷 1. 基本概念圖的遍歷指的是從圖中的某個頂點出發訪問圖中其餘的頂點，且每個頂點只被訪問一次的這個過程。通常來說，圖的遍歷次序有兩種：深度優先遍歷（Depth first Search, DFS）和廣度優先遍歷（Breadth First Se

吳恩達老師機器學習筆記K-means聚類演算法（二）

運用K-means聚類演算法進行影象壓縮趁熱打鐵，修改之前的演算法來做第二個練習—影象壓縮原始圖片如下：程式碼如下： X =imread('bird.png'); % 讀取圖片 X =im2double(X); % unit8轉成double型別 [m,n,z]=size

Spring MVC（二）基於標註的MVC

1.基於標註的Spring MVC 1.1 建立一個專案匯入jar包(ioc aop mvc) 拷貝容器對應的配置檔案到src下在WEB-INF建立一個login.jsp 1.2 在web.xml 配置一個DispatcherServlet 並且使用初始化引數 contextConfigLocati

Logistic迴歸之梯度上升優化演算法（二）

Logistic迴歸之梯度上升優化演算法（二）有了上一篇的知識儲備，這一篇部落格我們就開始Python3實戰 1、資料準備資料集：資料集下載資料集內容比較簡單，我們可以簡單理解為第一列X，第二列Y，第三列是分類標籤。根據標籤的不同，對這些資料點進行分類。

「日常訓練&知識學習」莫隊演算法（二）：樹上莫隊（Count on a tree II，SPOJ COT2）

題意與分析題意是這樣的，給定一顆節點有權值的樹，然後給若干個詢問，每次詢問讓你找出一條鏈上有多少個不同權值。寫這題之前要參看我的三個blog：CFR326D2E、CFR340D2E和HYSBZ-1086，然後再看這幾個Blog—— 參考A：https://blog.sengxian.com/algori

SpringSecurity（二）基於資料庫使用者登入

一、使用SpringSecurity提用的User物件 1. 新建一個MyUserService類 @Component public class MyUserService implements UserDetailsService { @Override public

理解GBDT演算法（二）——基於殘差的版本

相關推薦