1. 程式人生 > >Python 數據分析與挖掘的學習路徑

Python 數據分析與挖掘的學習路徑

手冊 vpd 工作原理 學習交流 交流 ESS 早期 otl ges

0.前言

很多人反映在學習了Python基礎之後無所適從,不知道下一步往哪走。作為較早期的跨界者(土木狗)深有體會。本文將結合上圖,為後來者指明方向,可作為參考。技術分享圖片
在此強調:如果打算依靠Python逃離現有的工作(如土木施工),那就要認真想想自己打算做哪一方面的工作,互聯網營銷、前端、運維、爬蟲、數據分析、數據挖掘、Web開發?強烈建議:直接上拉鉤或者Boss直聘,針對性學習更為穩妥。如果打算業余玩玩,那跟著我們一起業余吧,謔謔~

.在入門學習大數據的過程當中有遇見學習,行業,缺乏系統學習路線,系統學習規劃,歡迎你加入我的大數據學習交流裙:529867072 ,裙文件有我這幾年整理的大數據學習手冊,開發工具,PDF文檔書籍,你可以自行下載。

1.目標確定

凡事預則立,不預則廢。事先明確自己要處理事情,大體上有個方向。比如你準備分析當地房價,或是電商某種類數據,或是某個垂直領域的數據等。

2.數據獲取

爬蟲是Python初學者的必經之路,通過爬蟲既可以獲取數據,還可以理解Web的工作原理。前者可以作為數據分析的原料,後者可以作為數據Web可視化的基礎。至於你使用Request,還是Scrapy,或是Selenium,可以隨意一點,這不是公眾號【調包】的重點,度娘或GitHub有很多範例供大家參考。

3.數據分析

《利用Python進行數據分析》該書詳細講述了Pandas的使用,用它可以實現上圖流程之後的底層流程(數據整理、描述分析、洞察結論、報告撰寫),這個路徑可以稱之“數據分析”。

4.數據挖掘

上圖數據整理之後的上層路徑(建模分析、模型測試、叠代優化、模型加載、報告撰寫),這個路徑可以稱之“數據挖掘”。將會用到Sklearn、XGboost、Pytorch、TensorFlow、Spark、Hadoop等庫或工具。

5.報告撰寫
不管是數據分析還是數據挖掘,最終都要反映到報告中,可以在線動態展示數據、也可以是離線靜態報表,或者插入PPT。這個階段Matplotlib是基礎,至於用其他可視化庫或是非Python系的工具,可以隨意點,重點在於你分析的結論能否讓閱讀者肯定。

6.需求反饋

從報告撰寫再回到目標確定,這是一個產品叠代的閉環。類似於土木施工組織管理的PDCA。

Python 數據分析與挖掘的學習路徑