13份Python資料科學必備備忘錄,高清原版放送
這套Python資料科學備忘錄來源於國外的DataCamp.com網站,DataCamp是一個專業的資料科學課程培訓網站,提供各種資料科學課程的學習,同時也開放了很多實用有料的資料。
在資料科學的學習和工作中,我們會使用到很多的工具、模組和庫,當工具越來越多,我們需要理解和掌握的概念也就越來越多,這無論是對於初學者還是資料科學大牛來說,都是一個挑戰。
在這種情況下,一個完整全面的備忘錄就很有必要了,在一些概念模糊不清,模組的使用方法不確定的時候,快速地檢視備忘錄,可以極大地提高效率。
下面,我們就來了解一下這一套來自於DataCamp的Python資料科學備忘錄(原版高清PDF下載地址見文末)
文章目錄
- 初學者的Python資料科學備忘錄
- Pandas模組基本操作示例備忘錄
- Scikit-Learn機器學習備忘錄
- Jupyter notebook備忘錄
初學者的Python資料科學備忘錄
這份備忘錄,適用於Python資料科學的初學者,裡面涵蓋了Python中資料型別的基本操作方法、NumPy陣列的操作方法。
Pandas模組基本操作示例備忘錄
Pandas是Python資料科學的一大利器,廣泛地用於基礎資料的處理和清洗,這份備忘錄涵蓋了Pandas模組的資料結構、資料輸入輸出、資料選擇、資料排序、資料檢視等等諸多基礎操作。
Scikit-Learn機器學習備忘錄
Scikit-Learn是Python中非常著名的機器學習庫,它使用簡單、API呼叫方便,這個庫提供了機器學習從資料處理,到模型建立,到模型訓練,到模型評估一整個流程的支援,同時支援貝葉斯、隨機森林、決策樹、SVM等諸多傳統機器學習演算法和簡單的神經網路演算法。

NumPy基礎備忘錄
NumPy是Python中用於科學計算的一個強大第三方庫,這個NumPy備忘錄可以幫助你解決使用NumPy進行Python科學計算時所必需的基礎知識。
Scipy備忘錄
Scipy是Python中用於進行線性代數計算的一個庫,和NumPy庫類似。

Matplotlib基礎備忘錄
matplotlib是Python中經久不衰的資料視覺化庫,雖然現在各種基於JS的動態資料視覺化框架層出不窮,但是高質量的圖表生成還是得看matplotlib。
Pandas高階操作備忘錄
Pandas中有很多高階的資料處理和分析操作,但是可能平時用得少就忘了,這份備忘錄正好適合需要的適合翻一翻。

PySpark備忘錄
PySpark是在Python中操作Spark這個大資料分析平臺的第三方庫,這份備忘錄中涵蓋了PySpark的基礎操作和使用示例。

Keras備忘錄
Keras是一個功能強大且易於使用的Python深度學習庫,提供了高階的神經網路API讓我們可以快速地建立一個高效的深度學習模型。

PySQL/">Spark SQL備忘錄
SeaBorn備忘錄
seaborn是基於matplotlib的一個易於使用的資料視覺化庫,因為matplotlib的api過於複雜,所以它就誕生了。

Bokeh備忘錄
bokeh是另一個數據視覺化庫,與前面介紹的資料視覺化庫各有特點。

Jupyter notebook備忘錄
Jupyter可以說是做資料科學的小夥伴非常喜歡的一個工具了。

以上就是州的先生整理的來自於DataCamp的Python資料科學備忘錄,有需要的小夥伴可以在州的先生微信公眾號(ID:zmister2016)後臺回覆關鍵詞: 0014 ,獲取上述13份高清PDF版本的備忘錄