1. 程式人生 > >數據分析常用工具

數據分析常用工具

語言 工具包 發的 常微分方程 出版 關於 以及 行數 交互

NumPy
NumPy(Numerical Python的簡稱)是Python科學計算的基礎包。在本專題中的大部分內容都是基於NumPy以及構建於其上的庫,它提供了以下功能(不限於此):
- 快速高效的多位數組對象ndarray
- 用於對數組執行元素級計算以及直接對數組執行數學運算的函數
- 用於讀寫硬盤上的基於數組的數據集工具
- 線性代數計算、傅裏葉變換以及隨機數生成
- 用於將C、C++、Fortran代碼集成到Python工具中
除了Python提供快速的數組處理能力,NumPy在數據分析方面還有另外一個主要作用,即作為在算法之間傳遞數據的容器。對於數值型數據,NumPy數組在存儲和處理數據時要比內置的Python數據結構高效得多。此外,由低級語言(比如C和Fortran)編寫的庫可以直接操作NumPy數組中的數據,無需進行任何數據復制工作。

pandas
Pandas是python的一個數據分析包,最初由AQR Capital Management於2008年4月開發,並於2009年底開源出來,目前由專註於Python數據包開發的PyData開發team繼續開發和維護,屬於PyData項目的一部分。Pandas最初被作為金融數據分析工具而開發出來,因此,pandas為時間序列分析提供了很好的支持。 Pandas的名稱來自於面板數據(panel data)和python數據分析(data analysis)。panel data是經濟學中關於多維數據集的一個術語,在Pandas中也提供了panel的數據類型。


matplotlib

Matplotlib 是一個 Python 的 2D繪圖庫,它以各種硬拷貝格式和跨平臺的交互式環境生成出版質量級別的圖形 。通過 Matplotlib,開發者可以僅需要幾行代碼,便可以生成繪圖,直方圖,功率譜,條形圖,錯誤圖,散點圖等。

SciPy

SciPy是一款方便、易於使用、專為科學和工程設計的Python工具包.它包括統計,優化,整合,線性代數模塊,傅裏葉變換,信號和圖像處理,常微分方程求解器等等

類庫安裝

pip install NumPy
pip install pandas
pip install matplotlib
pip install SciPy

數據分析常用工具