1. 程式人生 > >python學習筆記——(2)pandas中的資料型別

python學習筆記——(2)pandas中的資料型別

    在用python進行資料處理的時候,自帶的五種資料型別使用起來顯然是有侷限性的,python之強大在於各種包,在資料處理中用的最多的就是pandas和numpy。本文章主要介紹pandas的資料結構。

    pandas有兩種資料結構

    series
    dataframe

    Series

pandas.Series(data=None, index=None, dtype=None, name=None, copy=False, fastpath=False)

    是一種帶標籤的一維陣列

    引數解釋:

    data: 陣列或者字典

    index:一維索引或者陣列

    copy:是否複製data

    變數宣告

obj = series([2,9,-10,333])    #通過陣列賦值    
dict = {'name':John',score':100}
obj_dict = Series(dict)

    屬性

    obj.values    #可以用list轉化為列表

    obj.index    #可以用list轉化為列表

    建立帶索引的series:

l = [2,9,-10,333]
index = ['a','b','c','d']
obj = pd.Series(l,index,name='score')

    按索引取值:

    obj['a']    #返回 4

    obj[['c','d']]    #返回 [-5,3]

    返回的型別仍然為series

    對series進行運算:   

e = obj[obj<0]    #返回e仍然為series
f = obj * 10    #返回的f仍然為series

對series進行修改:

obj['a'] = 10    #將a的值修改為10
obj.index = ['f','b','c','d']    #修改索引

    DataFrame

pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)

   DataFrame是一種類似表格的二維資料結構

    引數解釋

    data: numpy ndarray,字典或者dataframe

    index: 索引或者類似索引

    columns: 列名

    DataFrame建立

    從字典建立

    從numpy ndarray建立(二維列表)

    DataFrame索引

dic = {'name':['john','dick','lucy'],'sex':['man','man','woman'],'score':[100,80,90]}
index = ['first','second','third']
df = pd.DataFrame(dic,index = index)

    DataFrame取值

    取出某一列

df_name = df['name']  or df_name = df.name   #取出name列
df2 = df[['name','score']]    #取出兩列


    取出某一行

df.ix['first']
df.ix[0]

    取出某行某列

df['name']['first']
df.ix['first']['name']

    結果都為:john

    DataFrame內容修改

df['score'] = 100    #將所有的score修改為100

    DataFrame按行遍歷

array = df.values    #得到一個二維列表,每一行存在一個列表中
for row in array:
    print(row)