1. 程式人生 > >PYTHON 數據分析常用類庫

PYTHON 數據分析常用類庫

繪制數據 讀寫 系統 sparse 回歸 pyplot 包裝 數值積分 python庫

numpy 科學計算的基礎包
(1)快速高效多維的數組對象ndarray
(2)對數組執行元素級的計算以及直接對數組執行數學運算的函數
(3)讀寫硬盤上基於數組的數據集的工具
(4)線性代數運算,傅裏葉變換,以及隨機數生成
(5)將C、C++、Fortran代碼集成到python

scipy 專門解決科學計算中各種標準問題域的模塊的集合SciPy
主要包含了 8 個模塊,不同的子模塊有不同的應用,如插值、積分、優化、圖像處理和特殊函數等。scipy.integrate 數值積分例程和微分方程求解器。
scipy.linalg 擴展了由 numpy.linalg 提供的線性代數例程和矩陣分解功能。
scipy.optimize 函數優化器(最小化器)以及根查找算法。
scipy.signal 信號處理工具。scipy.sparse 稀疏矩陣和稀疏線性系統求解器。
scipy.special SPECFUN(這是一個實現了許多常用數學函數的 Fortran 庫)的包裝器。
scipy.stats 檢驗連續和離散概率分布、各種統計檢驗方法,以及更好的描述統計法。
scipy.weave 利用內聯 C++代碼加速數組計算的工具。

pandas 數據分析核心庫
?提供了一系列能夠快速、便捷地處理結構化數據的數據結構和函數。高性能的數組計算功能以及電子表格和關系型數據庫(如 SQL)靈活的數據處理功能。復雜精細的索引功能,以便便捷地完成重塑、切片和切塊、聚合及選取數據子集等操作。

matplotlib 繪制數據圖表的python庫
? Python的2D繪圖庫,非常適合創建出版物上用的圖表。操作比較容易,只需幾行代碼即可生成直方圖、功率譜圖、條形圖、錯誤圖和散點圖等圖形。提供了pylab的模塊,其中包括了NumPy和pyplot中許多常用的函數,方便用戶快速進行計算和繪圖。交互式的數據繪圖環境,繪制的圖表也是交互式的。

scikit-learn

據挖掘和數據分析工具
?簡單有效,可以供用戶在各種環境下重復使用。封裝了一些常用的算法方法。基本模塊主要有數據預處理、模型選擇、分類、聚類、數據降維和回歸 6 個,在數據量不大的情況下,scikit-learn可以解決大部分問題。

PYTHON 數據分析常用類庫