數據挖掘工具Modeler有哪些重要資源?如何操作?
Modeler是最早的Clementine是ISL公司開發的數據挖掘工具平臺。在1999年SPSS公司收購了ISL公司,對其數據挖掘產品進行重新整合和開發。
目前SPSS在IBM的旗下,數據挖掘工具Clementine命名為Modeler,統計分析工具命名為Statistic。
Modeler自帶的重要資源
Modeler基本操作
Modeler主窗口
數據流區域
數據流(stream)由一系列的節點構成,每個節點代表了對數據的某種處理,節點之間通過有方向的箭頭連接。
選項板區
分為收藏夾、源、記錄選項、字段選項、圖形、建模、輸出、導出八個欄
管理器窗口
管理器窗口中共包含了“流”、“輸出”、“模型”三個欄。
工程管理區
工程管理區含有兩個選項欄,一個是“CRISP-DM”,一個是“類”。
生成數據流的基本過程
向數據流區域增添新的節點;
雙擊選項板區中待添加的節點;
左鍵按住待添加節點,將其拖入數據流區域內;
先選中選項板區中待添加的節點,然後將鼠標放入數據流區域,在鼠標變為十字形時單擊數據流區域的任何空白處。
向數據流區域刪節點
左鍵單擊待刪除的節點,按鍵盤上的delete鍵刪除;
右鍵單擊待刪除的節點,在快捷菜單中選擇delete。
將節點連接到數據流中
雙擊節點
通過Alt鍵連接
手動連接
繞過數據流中的節點
將節點插入已存在的連接中
刪除連接
選擇待刪除的連接,單擊右鍵,從彈出的快捷菜單中選擇“刪除連接”;
選擇待刪除連接的節點,按F3鍵,刪除了所有連接到該節點上的連接;
數據流的執行
選擇菜單欄中的按鈕,數據流區域內的所有數據流將被執行;
先選擇要輸出的數據流,再選擇菜單欄中的按鈕,被選的數據流將被執行;
選擇要執行的數據流中的輸出節點,單擊鼠標右鍵,在彈出的快捷菜單中選擇“執行”選項,執行被選中的節點。
本文出自 “中科院計算所培訓” 博客,謝絕轉載!
數據挖掘工具Modeler有哪些重要資源?如何操作?