1. 程式人生 > >利用Python進行資料分析——第一章:重要Python庫安裝配置

利用Python進行資料分析——第一章:重要Python庫安裝配置

一. NumPy

NumPy全稱為Numerical Python,是Python科學計算的基礎包。提供功能有:

  • 快速高效的多維陣列物件ndarray;
  • 用於對陣列執行元素級計算及直接執行數學運算的函式;
  • 用於讀寫硬碟上基於陣列的資料集工具;
  • 線性代數運算、傅立葉變換與隨機數生成;
  • 用於將C、C++、Fortran程式碼整合到Python的工具;
二. pandas
提供了使我們能快速便捷地處理結構化資料的大量資料結構與函式。它是使得Python成為強大而高效的資料分析環境的重要因素之一。
三. matplotlib
最流行的用於繪製資料圖表的Python庫。
四. IPython
是Python科學標準工具集的組成部分,將所有其它東西聯絡在一起。是一個增強的Python shell,主要用於互動式資料處理和利用matplotlib對資料進行視覺化處理。
五. SciPy

SciPy是一組專門解決科學計算中各種標準問題域的包的集合。與NumPy有機結合完全可以替代MATLAB的計算功能。 六. 安裝配置
在Ubuntu下安裝Python模組通常可以使用apt-get和pip命令。apt-get命令是Ubuntu自帶的包管理命令,而pip則是Python安裝擴充套件模組的工具,通常pip會下載擴充套件模組的原始碼並編譯安裝。
Ubuntu 12.04中預設安裝了Python2.7.3,首先通過下面的命令安裝pip,pip是Python的一個安裝和管理擴充套件庫的工具。
sudo apt-get install python-pip
安裝Python開發環境,方便今後編譯其他擴充套件庫,佔用空間92.8M:
sudo apt-get install python-dev
    一、NumPy,SciPy、pandas和matplotlib
通過apt-get命令可以快速安裝這三個庫:
sudo apt-get install python-numpy
sudo apt-get install python-scipy sudo apt-get install python-pandas
sudo apt-get install python-matplotlib
如果需要通過pip編譯安裝,可以先用apt-get命令安裝所有編譯所需的庫:
sudo apt-get build-dep python-numpy
sudo apt-get build-dep python-scipy
然後通過pip命令安裝:
sudo pip install numpy
sudo pip install scipy
sudo pip install pandas

    二、安裝ipython

在Ubuntu下,安裝ipython很簡單:

$sudo apt-get install ipython

Ubuntu預設的python為2,所以如果要使用ipython3需要執行

$sudo apt-get install ipython3

如果想要使用ipython-qt,對於python2而言可以直接在軟體中心中安裝(當然,ipython也可以),對於ipyhon3-qt,則要麻煩一些。

$sudo apt-get source python-slip

$sudo apt-get python-qt4

然後對於新下載的原始碼,都進入原始碼目錄後執行:

$sudo python3 configure.py

$sudo make

$sudo make install

另外可以安裝IPython notebook:

sudo apt-get install ipython
sudo pip install tornado
sudo apt-get install libzmq-dev
sudo pip install pyzmq
sudo pip install pygments