1. 程式人生 > >pandas資料結構及資料讀寫

pandas資料結構及資料讀寫

1.資料結構

Series

類似python的字典。

建立:

pandas.Series([1,2,3,4,5], index=['a','b','c','f','e'])    #Index相當於字典的key
pandas.Series ( {'a':5} )    #用字典建立物件

查詢物件中的元素

s[['a','b','c']]    #直接查詢一組key,返回用這組key和對應value組成的新Series物件
s['a']    #直接查詢某個key,返回valu
head(n), tail(n)    #取出頭n行或尾n行的方法,預設n=5
index    values    #兩個物件屬性,可以取得key列表和values

元素統計方法

len(s)    #Series長度,包括NaN
s.count()    #Series長度,不包括NaN
s.unique()    #返回不重複values值
s.value_counts()    #value出現次數統計

DataFrame

建立   
pandas.DataFrame([s,s,s])    #使用Series建立,每一行為一個series
df=pandas.DataFrame([s1,s2])    #使用列表的列表建立,每一行為一個列表anaaffsfsdfa
df=pandas.DataFrame({"a":s1,"b":s2})    #使用字典結合列表建立,每一列為一個列表,字典key作為新物件的列的標題

檢視物件中的元素

df.columns    #返回列名稱列表
for index, row in df.iterrows():    #以行遍歷整個資料,返回值為每行資料的陣列
    print row.values
head(n), tail(n)    #取出頭n行或尾n行的方法,預設n=5

元素統計方法

df.shape    #返回資料行數和列陣列成的元素