1. 程式人生 > >使用python進行資料分析介紹及部分教程

使用python進行資料分析介紹及部分教程

Python是一種面向物件、直譯式計算機程式設計語言,由Guido van Rossum於1989年底發明。由於他簡單、易學、免費開源、可移植性、可擴充套件性等特點,Python又被稱之為膠水語言。下圖為主要程式語言近年來的流行趨勢,Python受歡迎程度扶搖直上。


圖片來源用Python玩轉資料

由於Python擁有非常豐富的庫,使其在資料分析領域也有廣泛的應用。由於Python本身有十分廣泛的應用,本期Python資料分析路線圖主要從資料分析從業人員的角度講述Python資料分析路線圖。整個路線圖計劃分成16周,120天左右。主要學習內容包括四大部分:

1)Python工作環境及基礎語法知識瞭解(包括正則表示式相關知識學習);

2)資料採集相關知識(python爬蟲相關知識);

3)資料分析學習;

4)資料視覺化學習。


PYTHON學習路徑計劃圖

Python工作環境及基礎語法知識瞭解

對於Python基礎語法學習部分,學習週期大概為4周,需要的相關資源在網路上都能找到免費的資源,而且質量都不錯。相關中文資源如下:

1.python工作整合環境包

Python(x,y):下載地址

Pycharm:下載地址

2.python資料分析相關庫(Pandas/ Numpy/

Scipy/ Matplotlib)

如果安裝了上面整合工作包,則下面的包不需要重新安裝了。關於包的安裝方法在學習資源圖書中都有介紹,通常安裝庫採用pip方法,也可以用pip list查詢系統安裝了哪些庫。

3.學習資源

圖書:1)Python基礎教程(第2版)[電子版圖書自行百度]

2)深入淺出Head First python(中文版)[電子版圖書自行百度]

2)正則式學習

資料採集學習

對於資料採集部分的學習主要是通過python爬蟲的學習瞭解基本的外部資料採集情況,當然也可以藉助別人寫好的規則庫直接完成某些資料的採集。這部分內容的學習週期大概也為四周,需要的相關資源在網路上都能找到免費的資源,而且質量都不錯。相關中文資源如下:

爬蟲學習線上教程:

資料分析

Python資料分析的學習主要是對相關庫的使用,比如資料整理需要用到numpy和pandas庫,資料描述與分析分析則主要用到pandas庫,從某種程度上講,利用python進行資料分析的學習過程就是對庫的學習過程。由於有了前面2部分內容的學習基礎,本部分內容的建議學習練習時間也為4周,相關免費學習資源如下:

視訊:用python玩轉資料[視訊為cousera認證課程,全程中文]

資料視覺化

Python資料視覺化學習的過程就是學習matplotlib庫的過程,matplotlib庫包含有豐富的資料視覺化資源,地圖、3D等等都有涉及,如果有前面3部分的學習經驗的話,這部分內容在4周內也能解決。相關中文學習資源如下:

線上教程: