1. 程式人生 > >判斷dataframe是否有重複行索引或列索引和drop_duplicates用法

判斷dataframe是否有重複行索引或列索引和drop_duplicates用法

判斷列索引是不是重複
print(data.index.is_unique)
False#表示有重複
判斷列是不是有重複
print(data.index.is_unique)
False#表示有重複

drop_duplicates刪去重複資料
DataFrame.drop_duplicates(subset=None, keep=‘first’, inplace=False)

subset : column label or sequence of labels, optional
用來指定特定的列,預設所有列

keep : {‘first’, ‘last’, False}, default ‘first’
刪除重複項並保留第一次或者最後一次出現的項

inplace : boolean, default False
是直接在原來資料上修改還是保留一個副本