利用Python進行資料分析_Pandas_處理缺失資料
阿新 • • 發佈:2018-12-18
申明:本系列文章是自己在學習《利用Python進行資料分析》這本書的過程中,為了方便後期自己鞏固知識而整理。
1 讀取excel資料
import pandas as pd import numpy as np file = 'D:\example.xls' df = pd.DataFrame(pd.read_excel(file)) df
2 檢測缺失值
2.1 isnull返回一個含有布林值的物件
import pandas as pd import numpy as np file = 'D:\example.xls' df = pd.DataFrame(pd.read_excel(file)) df= df.isnull() df
2.2 notnull 是isnull 的否定式
import pandas as pd import numpy as np file = 'D:\example.xls' df = pd.DataFrame(pd.read_excel(file)) df = df.notnull() df
3 濾除缺失資料
3.1 濾除所有包含缺失值的行
df.dropna()
3.2 檢視不含缺失值的所有行、列
df.dropna(thresh=4)
4 填充缺失資料
DataFrame.fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None, **kwargs)
4.1 統一填充某一個值value
df.fillna(0)或df.fillna(value=0)
4.2 用前面的值填充缺失部分
df.fillna(method='ffill')
4.3 用後面的值填充缺失部分
df.fillna(method='bfill')
4.3 某N列用特定的值填充缺失部分
df.fillna({'起息日':'2018-12-11','評級得分':'100'})
4.4 指定一整個軸的值填充缺失部分
df.fillna(method='ffill',axis=1)