1. 程式人生 > >python資料結構:pandas(3)

python資料結構:pandas(3)

 一、pandas資料操作:

  1.處理缺失資料

    (1)判斷是否存在缺失值

      ser_obj.isnull(),df_obj.isnull()

    (2)dropna:丟棄缺失資料

    (3)fillna:填充缺失值

  2.常用的統計計算

import numpy as np
import pandas as pd
df1 =pd.DataFrame(np.random.randn(5,4),columns=['a','b','c','d'])
print(df1)

    (1)sum,mean,max,min.......

    (2)axis=0按照列統計,axis=0按照行進行統計

#求和,求出各列的最大值,預設是axis=的方向
print('df1.sum=\n',df1.sum())
#打印出df1的最大值,求出df1各列的最大值
print('df1.max()=\n',df1.max())
求出水平方向各列的最大值
print('水平方向的最大值=\n',df1.max(axis=1))

#求出水平方向各行的和
print('水平方向各行的和',df1.sum(axis=1))
print('各個值的描述為:\n',df1.describe())

    (3)skipna排除缺失值,預設為True

    (4)idmax,idmin,cumsum

    (5)describe()描述多個數據

二、pandas層級索引