1. 程式人生 > >R語言決策樹演算法

R語言決策樹演算法

1,生成樹:rpart()函式raprt(formular,data,weight,subset,na.action=na.rpart,method,model=FALSE,x=FALSE,y=TRUE,parms,control,cost,...)         fomula :模型格式形如outcome~predictor1+predictor2+predictor3+ect。         data     :資料。         na.action:缺失資料的處理辦法,預設為刪除因變數缺失的觀測而保留自變數缺失的觀測。         method:樹的末端資料型別選擇相應的變數分割方法,連續性method=“anova”,離散型使用method=“class”,,計數型method=“poisson”,生存分析型method=“exp”。          parms:設定三個引數,先驗概率,損失矩陣,分類矩陣的度量方法。          control:控制每個節點上的最小樣本量,交叉驗證的次數,複雜性參量:cp:complexity pamemeter。      2,剪枝使用          prune(tree,cp,....)           tree常是rpart()的結果物件,cp 複雜性參量       3 顯示結果的語句
printcp(fit)顯示覆雜性表plotcp(fit)畫交叉驗證結果圖rsq.rpart(fit)R-squared 和 relative error for different splits (2 plots). labels are only appropriate for  "anova" method.print(fit)列印結果summary(fit)基本資訊plot(fit)畫決策樹text(fit)給樹新增標籤post(fit,file=)儲存結果ps,pdf,等格式  # Classification Tree with rpart