1. 程式人生 > >簡要說明python pandas中groupby,agg等的用法

簡要說明python pandas中groupby,agg等的用法

以下列程式碼為例:

import numpy as np
import pandas as pd
import pandas as pd
df = pd.DataFrame({'key1':list('aaaab'),
                  'key2': ['one','two','one','two','one'],
                  'data1': np.random.randn(5),
                  'data2': np.random.randn(5)})
print df
print "%%%%%"
print df.groupby('key1'
) print "%%%%%" print df.groupby('key1').agg('sum')

得到df如下:
df為pd中的dataframe,groupby(‘列名’),相當於以這一列進行預分類。列印結果為:
然後agg()是對上面內容的操作。這裡是sum,所以累加:
PS:試圖只選取data1這一列進行計算,從而寫了個df['data1'],不行。這樣做只單單選中了data1這一列!
PS:df['data1']是series型別,df[['data1']]是dataframe型別