機器學習筆記之十——整合學習之Bagging

阿新 • • 發佈：2018-12-24

上一節學習了決策樹：https://blog.csdn.net/qq_35946969/article/details/85039097

最後說到提升決策樹的效能，整合就是非常強大的解決方案。

藉助一個圖，直觀的瞭解整合學習：

Bagging

Bagging是整合個體學習器的一種方式，它的思想十分簡單：

a.對原始樣本進行有放回取樣，得到一個樣本子集，用這個樣本子集去訓練，得到一個學習器。

b.重複以上步驟，得到n個樣本子集，訓練出n個學習器。

c.預測目標樣本時，用這n個學習器進行投票法（分類問題中）、平均值法（迴歸問題中）等方法。

Random Fores（隨機森林，RF）

隨機森林時Bagging方法的典型代表，同時也是決策樹的提升優化。

隨機森林的過程：（1）、從總樣本中有放回的隨機取樣，得到m組樣本子集。

（2）、在m組樣本子集中，各自分別隨機選擇K個特徵值作為本子集的訓練特徵，訓練出m個決策樹。

（3）、predict——以m個弱分類器預測的結果投票或者取平均值。

以上即是隨機森林的思想，sklearn的實現中，需要調整的引數一般是決策樹的數目（50~100），特徵數量K，結果的預測的方法以及決策樹中的一些引數。

Extra Tree

Extra Tree 是隨機森林的一個變種，不常用。但是在隨機森林都過擬合的情況下，可以嘗試這個演算法。

Extra Tree和隨機森林的主要區別如下：

（1）、RF用於訓練的樣本子集是隨機取樣的，而Extra Tree每次都直接使用原始樣本。

（2）、RF特徵選擇使用的是最優選擇（即使用資訊增益、基尼係數等選擇），而Extra Tree則是使用隨機選擇的方式。因為是隨機選擇，所以一般Extra Tree生成的決策森林一般比較大，方差較小，泛化能力強。

Totally Random Tree Embedding(TRTE)

TRTE不是分類迴歸演算法，而是一種非監督的資料轉化方式，可以將低維的資料對映到高維，從而讓高維的資料更好得用於分類迴歸模型。。

Isolation Forest（IForest）

一種異常點檢測演算法。

機器學習筆記之十——整合學習之Bagging

上一節學習了決策樹：https://blog.csdn.net/qq_35946969/article/details/85039097 最後說到提升決策樹的效能，整合就是非常強大的解決方案。藉助一個圖，直觀的瞭解整合學習： Bagging &nbs

《機器學習實戰》學習筆記（十二）之利用PCA來簡化資料

轉載請註明作者和出處：http://blog.csdn.net/john_bh/ 執行平臺： Windows Python版本： Python3.6 IDE： Sublime text3 一、降維技術 1.1 什麼是降維降維就是

python學習筆記（十一）之函數

last 函數返回 traceback keep disco show 全局變量 not 默認參數牛刀小試：　　定義一個無參函數 1 >>> def myFirstFunc(): 2 ... print("Hello python

python學習筆記（十五）之集合

head erro sdi pytho not in 註意 inter ren mod 集合：對應數學中的集合類型。集合中的元素是唯一，且無序的。創建集合　　方法一：使用{}，註意python會自動刪除重復元素 >>> number = {1,2,3

學習筆記——第十周學習筆記

public 數據 save 私有 birt 全局後臺 sel 定義一、使用ADO.NET改寫控件載入信息的代碼 1 EduBase eduBase=new EduBase(); 2 var student=(from s in eduBase.studen

Python3《機器學習實戰》學習筆記（十二）：線性迴歸提高篇之樂高玩具套件二手價預測

一、前言本篇文章講解線性迴歸的縮減方法，嶺迴歸以及逐步線性迴歸，同時熟悉sklearn的嶺迴歸使用方法，對樂高玩具套件的二手價格做出預測。二、嶺迴歸如果資料的特徵比樣本點還多應該怎麼辦？很顯然，此時我們不能再使用上文的方法進行計算了，因為矩陣X不是滿秩矩

《機器學習實戰》學習筆記（十）之使用Apriori演算法進行關聯

轉載請註明作者和出處：http://blog.csdn.net/john_bh/ 執行平臺： Windows Python版本： Python3.6 IDE： Sublime text3 背景一、關聯分析二、Apriori原理

Andrew Ng機器學習課程筆記（十二）之無監督學習之K-means聚類演算法

Preface Unsupervised Learning（無監督學習） K-means聚類演算法 Unsupervised Learning 我們以前介紹的所有演算法都是基於有類別標籤的資料集，當我們對於沒有標籤的資料進行分類時，以前的方

非監督學習之混合高斯模型和EM演算法——Andrew Ng機器學習筆記（十）

0、內容提要這篇博文主要介紹： - 混合高斯模型（mixture of Gaussians model） - EM演算法（Expectation-Maximization algorithm） 1、引入假設給定一個訓練集{x(1),...,x(m)

Andrew Ng機器學習課程筆記（十六）之無監督學習之因子分析模型與EM演算法

Preface Marginals and Conditionals of Gaussians（高斯分佈的邊緣分佈與條件分佈） Restrictions of ΣΣ（限制協方差矩陣） Factor Analysis（因子分析模型） EM Alg

Java學習筆記二十一:Java面向對象的三大特性之繼承

類構造接下來多重通過 prot 圖片等級 ++ class Java面向對象的三大特性之繼承一：繼承的概念；　　繼承是java面向對象編程技術的一塊基石，因為它允許創建分等級層次的類。　　繼承就是子類繼承父類的特征和行為，使得子類對象（實例）具有父

嵌入式核心及驅動開發之學習筆記（十）非同步通訊+中斷實現讀取資料

對於linux一切都是檔案，驅動裝置在應用層也是以檔案的形式進行讀寫。之前學了阻塞、非阻塞、多路複用的方式讀裝置，它們都需要應用主動讀取。那麼應用層有沒有一種方式，當底層將資料準備好了，應用程式自動處理這些資料？通過非同步通訊可以實現，這有寫類似硬體層的中斷概念驅動層（準備好了資料） --&g

Android開發學習筆記（十二）基礎UI控制元件之ImageView、CheckBox、RadioButton

一、ImageView：直接繼承自View,它的作用是在介面上顯示Drawable物件。 ImageView在佈局檔案(如main_activity.xml)中常用的屬性有 scaleType ,s

Android開發學習筆記（十四）基礎UI控制元件之Spinner

Spinner：彈出一個列表選擇框，供使用者選擇。繼承自ViewGroup，因為可以容納很多列表項，因此它也是一個容器控制元件。給Spinner指定資料來源的2種方法：一、通過指定xml檔案來指

Android開發學習筆記（十五）基礎UI控制元件之ListView

一、ListView常用XML屬性： android:choiceMode="" 設定ListView的選擇行為 android:divider="" 設定List列表項的分隔條（即可用顏

Android開發學習筆記（十六）基礎UI控制元件之ListView-SimpleAdapter

一、ListView控制元件： <ListView android:id="@+id/list_view_demo" android:layout_width="match_pa

opencv學習筆記五十九：影象融合之背景替換

以證件照為例，圖片中有大部分為背景，先用kmeans對影象進行分割，可以得到背景的標籤，然後將影象分為前景和背景兩部分，非背景的都當作前景，顯示kmeans分割後的影象dst，將原影象前景賦給dst, 背景都設為0，得到kmeans分割後的影象如下，可看到邊緣處有一些小藍邊，

opencv學習筆記六十五：人臉識別演算法之EigenFace

簡要：特徵臉演算法是將影象每一個畫素當作一維特徵，然後用SVM或其它機器學習演算法進行訓練。但這樣維數太多，根本無法計算。我這裡用的是ORL人臉資料庫，英國劍橋實驗室拍攝的，有40位志願者的人臉，在不同表情不同光照下每位志願者拍攝10張，共有400張圖片，大小為112*9

嵌入式核心及驅動開發之學習筆記（十七）裝置樹的定義規則和獲取方法

概述在Linux 2.6中，arch/arm/plat-xxx和arch/arm/mach-xxx中充斥著大量的垃圾程式碼，相當多數的程式碼只是在描述板級細節，而這些板級細節對於核心來講，不過是垃圾，如板上的platform裝置、resource、i2c_board_info、sp

嵌入式核心及驅動開發之學習筆記（十一）中斷優化處理

ARM cortex-A系列的核心不支援中斷巢狀。在核心中斷函式中，如果中斷處理時間過長，產生中斷巢狀，重者系統崩潰，輕者也會影響其他事件處理。這也是中斷中不能使用延時函式的原因。但是有些高實時性裝置（比如網絡卡），就是需要處理大量的業務。為了滿足中斷處理時間儘量短的原則

機器學習筆記之十——整合學習之Bagging

Bagging

Random Fores（隨機森林，RF）

Extra Tree

Totally Random Tree Embedding(TRTE)

Isolation Forest（IForest）

相關推薦