1. 程式人生 > >python之Pandas庫的基本操作

python之Pandas庫的基本操作

Pandas的安裝比較容易,安裝好Numpy之後,可以通過pip install pandas直接或者下載原始碼之後安裝,但是預設的Pandas還不能讀寫Excel檔案,需要安裝xlrd(讀),xlwt(寫)庫才能支援Excel的讀寫,方法如下:

pip install xlrd   為python新增讀入Excel的功能

pip install xlwt  為python新增寫入Excel的功能 

簡單操作程式碼如下:

#Pandas的簡單例子,使用操作
import pandas as pd #通常用pd做pandas別名

s = pd.Series([1,2,3],index = ['a','b','c']) #建立一個序列s
d = pd.DataFrame([[1,2,3],[4,5,6],[1,2,3],[4,5,6],[1,2,3],[4,5,6],[1,2,3],[4,5,6]],columns = ['a','b','c']) #建立一個表格
d2 = pd.DataFrame(s) #也可以用已有序列建立表格

print(d.head()) #預覽前五行資料
print(d.describe()) #資料基本統計量

#讀取檔案,注意檔案的儲存路徑不能帶有中文,否則讀取可能出錯
print(pd.read_excel('F:\data.xls')) #讀取Excel檔案,建立DataFrame
#執行出錯,不知原因
#print(pd.read_csv('F:\data.csv',encoding = 'utf-8')) #讀取文字格式資料,一般用encoding指定編碼

pandas的基本資料結構是series和DataFrame