1. 程式人生 > >python-數據處理的包Numpy,scipy,pandas,matplotlib

python-數據處理的包Numpy,scipy,pandas,matplotlib

基本功 基礎 list 簡單的 pan 計算 and 處理 圖像處理

一,NumPy包(numeric python,數值計算)

該包主要包含了存儲單一數據類型的ndarry對象的多維數組和處理數組能力的函數ufunc對象。是其它包數據類型的基礎。只能處理簡單的數據分析能力,對於高級的數據處理和大數據分析,采用pandas包。

python自帶的list可以包含不同類型的數據,原因是list保存的實際是這些數據的指針,這樣才能實現不同類型的數據都能保存在list中。但缺點是這樣的保存方式消耗內存,運行工作量大。

二,Scipy包(scientific python,科學計算)

主要用於數據處理,包括統計分析,優化,整合,線性代數,傅裏葉變換,信號處理,圖像處理,常微分方程求解等,依賴與Numpy包,因為numpy是該包數據類型來源。

三,Pandas包

主要用於數據清洗,整理,建立在numpy上。

擅長處理大數據(文本,csv,excel等數據)。數據也來自與numpy類型數據,因此依賴numpy包

四,matplotlib包

matplotlib也是基於numpy的包,主要負責數據的可視化顯示。

五,scikit-learn包

機器學習,建立在scipy基礎上

基本功能被分為六個部分,分類,回歸,聚類,數據降維,數據選擇,數據預處理

六,Nltk包

自然語言處理

七,Pattern包

網絡挖掘

八,Theano包

深度學習

九,Scrappy包

網絡爬蟲

參考文獻:z00182 python與數據科學

python-數據處理的包Numpy,scipy,pandas,matplotlib