轉載使用隨機森林（R語言）做迴歸

引言

隨機森林( random forest) 是一種基於分類樹( classification tree) 的演算法，它可以用於分類和迴歸，本文在這裡以廣西地區1990-2014共25年的GDP資料作為因變數，以INV投資、CON消費、NEX淨出口為三個自變數，運用R語言軟體做隨機森林迴歸，最終得到三個自變數的相對重要程度。

1 資料

從廣西統計年鑑中取得1990-2014年的因變數與自變數資料，放入excel表格中。
QQ截圖20160407190804.jpg

2 步驟

2.1 安裝`randomForest`包

在R語言中，randomForest包提供了隨機森林的實現，使用randomForest需要先安裝這個包，在R的互動命令中使用下面的命令安裝：

1	`>` `install.packages("randomForest")`

然後在彈出的映象列表中選擇一個國內的映象站點就可以自動安裝了。

2.2 使用`randomForest`包

在R的互動命令中引入randomForest：

1	`>` `library(randomForest)`

螢幕上會輸出randomForest包的版本資訊。

2.3 匯入資料

將已經整理好的excel資料放入R語言的workspace中，或將R的工作空間載入為存有excel的資料夾。
將資料匯入到R中並檢視：

123456789

> gxdata <- read.csv("gxdata1990-2014.csv")> gxdata

X gdp con inv nex1 1990 449.06 175.4369 68.5666 8.06112 1991 518.59 200.2276 89.6479 10.16703 1992 646.60 243.6189 141.0395 29.2378...24 2013 14449.90 5133.1000 11907.6669 862.218125 2014 15672.89 5772.8317 13843.2123 996.4330

2.4 資料的初步處理

在這裡我們通過兩個步驟將每一行的名字以年份命名。首先去掉第一列（年份），將去掉後的矩陣命名為gxdata_without_x，然後檢視新生成的矩陣，命令如下：

123456789 > gxdata_without_x <- gxdata[,-1]> gxdata_without_xgdp con inv nex1 449.06 175.4369 68.5666 8.06112 518.59 200.2276 89.6479 10.16703 646.60 243.6189 141.0395 29.2378……24 14449.90 5133.1000 11907.6669 862.218125 15672.89 5772.8317 13843.2123 996.4330

第二步，取出gxdata矩陣中的第一列gxdata[,1]（年份），給矩陣的每一行命名，可檢視新的矩陣，命令如下：

123456789 > row.names(gxdata_without_x) <- gxdata[,1]> gxdata_without_xgdp con inv nex1990 449.06 175.4369 68.5666 8.06111991 518.59 200.2276 89.6479 10.16701992 646.60 243.6189 141.0395 29.2378……2013 14449.90 5133.1000 11907.6669 862.21812014 15672.89 5772.8317 13843.2123 996.4330

2.5 多元線性迴歸分析

利用2.4中處理好的矩陣gxdata_without_x，以CON、INV、NEX為自變數，GDP為因變數做多元迴歸分析，檢視多元線性迴歸分析在本例中的分析結果。命令及顯示結果如下：

123456789101112131415161718192021

> gx.lm <- lm(gdp~con+inv+nex,data = gxdata_without_x)> summary(gx.lm)Call:lm(formula = gdp ~ con + inv + nex, data = gxdata_without_x)Residuals:Min 1Q Median 3Q Max -657.08 -97.80 -20.73 53.71 613.23 Coefficients:Estimate Std. Error t value Pr(>|t|) (Intercept) 123.88962 101.58446 1.220 0.2361 con 2.31725 0.21224 10.918 4.07e-10 ***inv -0.05828 0.08507 -0.685 0.5008 nex 3.64880 1.55491 2.347 0.0288 *

轉載使用隨機森林（R語言）做迴歸

引言

1 資料

2 步驟

2.1 安裝`randomForest`包

2.2 使用`randomForest`包

2.3 匯入資料

2.4 資料的初步處理

2.5 多元線性迴歸分析

轉載使用隨機森林（R語言）做迴歸

隨機森林（Random Forest）--- 轉載

信用卡評分模型（R語言）

用一個簡單的例子比較SVM，MARS以及BRUTO（R語言）

3. 集成學習（Ensemble Learning）隨機森林（Random Forest）

3. 整合學習（Ensemble Learning）隨機森林（Random Forest）

協方差矩陣和相關係數矩陣（R語言）

同一介面畫出多個QQ圖（R語言）

[Machine Learning & Algorithm] 隨機森林（Random Forest）

決策樹模型（R語言）

統計學——中心極限定理（R語言）

二分類模型效能評價（R語言，logistic迴歸，ROC曲線，lift曲線，lorenz曲線）

隨機森林（Random Forest）入門與實戰

（R語言）編寫自己的函式

R（2）時間序列分析及應用之TSA安裝（R語言）

機器學習：隨機森林（Random Forest）

R語言︱機器學習模型評估方案（以隨機森林演算法為例）

機器學習(十三) 集成學習和隨機森林（上）

機器學習(十三) 集成學習和隨機森林（下）

《深度學習精要（基於R語言）》高清中文版PDF+高清英文版PDF+源代碼

轉載使用隨機森林（R語言）做迴歸

引言

1 資料

2 步驟

2.1 安裝randomForest包

2.2 使用randomForest包

2.3 匯入資料

2.4 資料的初步處理

2.5 多元線性迴歸分析

相關推薦

2.1 安裝`randomForest`包

2.2 使用`randomForest`包