1. 程式人生 > >利用Python學習資料探勘【0】

利用Python學習資料探勘【0】

相信看到這篇文章的你一定是對資料分析,資料探勘有興趣,或者想從事和方面。本文不再累述python對資料分析的重要,資料分析這門的由來之類的。

在這裡,我單刀直入,已我學習資料探勘3年來的經歷告訴大家怎麼去學,以讓大家少走彎路。純個人見解,如有不對,還請各位留言指教。

話不多說,直接放圖。

一  學好工具
python語言

推薦看廖雪峰的python3教程。

資料分析python基礎

如list,tuple,dic,set等。我之後的部落格會寫到。

二  獲取資料
python爬蟲

推薦一本書:《Python網路資料採集》(web Scraping with Python)   Ryan Mitchell 寫的,非常好。讀完這本書+實戰幾次爬蟲你就算熟練了。我之後寫的爬蟲部落格也會以讀這本書時的讀書筆記來寫。

實戰推薦崔慶才的部落格,也可以看我之後寫的爬蟲實戰部落格,我是按照他大框架來進行學習的。

三 資料的儲存與讀取
資料的IO,EXCEL,CSV,JSON,SQL資料庫。HDF5等。

四 NUMPY PANDAS SCIPY MATPLOTLIB
Numpy陣列

Pandas 資料分析

Scipy 矩陣

Matplotlib 資料視覺化

這一部分推薦看《Python資料分析》(Python Data Analysis)Lvan Idris寫的。

五 資料預處理
對採集來或現成的資料進行預處理,資料清洗(推薦看《乾淨的資料=Clean data:資料清洗入門與實踐》作者:Megan Squire),資料整合,資料變換,資料規約等。這一部分有興趣可以看一本書 《Python資料分析與挖掘實戰》。這本書看個框架就行。其實寫的不咋的。浪費了我好久時間。

六 建模 機器學習
學習各種機器學習,資料分析演算法。

演算法原理推薦看《資料探勘十大演算法》作者:Xindong Wu,Vipin Kumar

python實現推薦看《Python資料分析與挖掘實戰》+《Python資料分析》+《機器學習實戰》

七 神經網路
再往深就是深度學習,神經網路。

寄語:
學習每一個都需要付出很大量時間,精力與努力。希望你是真的對資料探勘,資料分析有興趣。