python-數據處理的包Numpy,scipy,pandas,matplotlib
阿新 • • 發佈:2018-10-06
基本功 基礎 list 簡單的 pan 計算 and 處理 圖像處理
一,NumPy包(numeric python,數值計算)
該包主要包含了存儲單一數據類型的ndarry對象的多維數組和處理數組能力的函數ufunc對象。是其它包數據類型的基礎。只能處理簡單的數據分析能力,對於高級的數據處理和大數據分析,采用pandas包。
python自帶的list可以包含不同類型的數據,原因是list保存的實際是這些數據的指針,這樣才能實現不同類型的數據都能保存在list中。但缺點是這樣的保存方式消耗內存,運行工作量大。
二,Scipy包(scientific python,科學計算)
主要用於數據處理,包括統計分析,優化,整合,線性代數,傅裏葉變換,信號處理,圖像處理,常微分方程求解等,依賴與Numpy包,因為numpy是該包數據類型來源。
三,Pandas包
主要用於數據清洗,整理,建立在numpy上。
擅長處理大數據(文本,csv,excel等數據)。數據也來自與numpy類型數據,因此依賴numpy包
四,matplotlib包
matplotlib也是基於numpy的包,主要負責數據的可視化顯示。
五,scikit-learn包
機器學習,建立在scipy基礎上
基本功能被分為六個部分,分類,回歸,聚類,數據降維,數據選擇,數據預處理
六,Nltk包
自然語言處理
七,Pattern包
網絡挖掘
八,Theano包
深度學習
九,Scrappy包
網絡爬蟲
參考文獻:z00182 python與數據科學
python-數據處理的包Numpy,scipy,pandas,matplotlib