1. 程式人生 > >決策樹之隨機森林

決策樹之隨機森林

一、簡單介紹 1、Bootstraping 一種有放回抽樣的選擇訓練樣本資料的方法。 2、Bagging策略 在這裡插入圖片描述 二、隨機森林 一個樣本集合中有n個樣本,用Bootstrap方法對它取樣m次就會得到m個有n個樣本的樣本集合,就等於得到了m個訓練資料集。對於每一個訓練資料集,我們隨機選擇K個屬性,其他的屬性都扔掉,然後建立CART決策樹。最後m個CART決策樹形成決策森林。 在這裡插入圖片描述 三、使用Bagging思路實現迴歸 在這裡插入圖片描述 演算法如下: 在這裡插入圖片描述 效果展示: 在這裡插入圖片描述 四、訓練資料和測試資料不均衡的處理辦法 在這裡插入圖片描述