1. 程式人生 > >《Python資料分析與挖掘實戰》筆記(一):資料探勘基礎

《Python資料分析與挖掘實戰》筆記(一):資料探勘基礎

一、資料探勘的基本任務

利用分類與預測、聚類分析、關聯規則、時序模式、偏差檢測、智慧推薦等方法,幫助企業提取資料中蘊含的商業價值,提升企業的競爭力。

二、資料探勘建模過程

定義挖掘目標:任務目標和完成效果

資料取樣:相關性、可靠性、有用性

資料探索:資料質量分析、資料特徵分析

資料預處理:資料篩選、資料變換、缺失值處理、壞資料處理、資料標準化,主成分分析、屬性選擇、資料規約等

挖掘建模:本次建模屬於哪一類問題,選擇哪種演算法建模

模型評價:選擇最好的模型

三、常用的資料探勘建模工具

SAS Enterprise Miner IBM SPSS Modeler SQL Server(Analysis Servers)
Python WEKA KNIME RapidMiner TipDM