1. 程式人生 > >對DataFrame中的資料進行按區間切分進行分組

對DataFrame中的資料進行按區間切分進行分組

import pandas as pd

#設定切分割槽域
listBins = [0, 10, 20, 30, 40, 50, 60, 1000000]

#設定切分後對應標籤
listLabels = ['0_10','11_20','21_30','31_40','41_50','51_60','61及以上']

#利用pd.cut進行資料離散化切分
"""
pandas.cut(x,bins,right=True,labels=None,retbins=False,precision=3,include_lowest=False)
x:需要切分的資料
bins:切分割槽域
labels:對應標籤,用標記來代替返回的bins,若不在該序列中,則返回NaN
retbins:是否包含右端點,預設False,不包含
precision:精度
include_lowest:是否包含左端點,預設False,不包含
"""
df['fenzu'] = pd.cut(df['data'], bins=listBins, labels=listLabels, include_lowest=True)