pandas中DataFrame修改index、columns名的方法
阿新 • • 發佈:2018-11-10
一般常用的有兩個方法:
1、使用DataFrame.index = [newName],DataFrame.columns = [newName],這兩種方法可以輕鬆實現。
2、使用rename方法(推薦):
DataFrame.rename(mapper = None,index = None,columns = None,axis = None,copy = True,inplace = False,level = None )
引數介紹:
mapper,index,columns:可以任選其一使用,可以是將index和columns結合使用。index和column直接傳入mapper或者字典的形式。
axis:int或str,與mapper配合使用。可以是軸名稱(‘index’,‘columns’)或數字(0,1)。預設為’index’。
copy:boolean,預設為True,是否複製基礎資料。
inplace:布林值,預設為False,是否返回新的DataFrame。如果為True,則忽略複製值。
import numpy as np
import pandas as pd
from pandas import Series, DataFrame
df1 = DataFrame(np.arange(9).reshape(3, 3), index = ['bj', 'sh', 'gz'], columns=['a', 'b', 'c'])
print(df1)
'''
a b c
bj 0 1 2
sh 3 4 5
gz 6 7 8
'''
# 修改 df1 的 index
print(df1.index) # 可以打印出print的值,同時也可以為其賦值
df1.index = Series(['beijing', 'shanghai', 'guangzhou'])
print(df1)
'''
a b c
beijing 0 1 2
shanghai 3 4 5
guangzhou 6 7 8
'''
# 可以使用map方法進行對映,map的使用方法就和python中的map幾乎一樣
print(df1.index.map(str.upper)) # Index(['BEIJING', 'SHANGHAI', 'GUANGZHOU'], dtype='object')
print(df1) # 結果 並未改變, 上面只是返回一個 dataframe 而已
'''
a b c
beijing 0 1 2
shanghai 3 4 5
guangzhou 6 7 8
'''
# 如果 需要 改變的話,可以如下: 另外賦值給一個變數
df1.index = df1.index.map(str.upper)
print(df1) # 這樣 就 改變了
'''
a b c
BEIJING 0 1 2
SHANGHAI 3 4 5
GUANGZHOU 6 7 8
'''
# 更快捷的 方法 使用 rename,可以分別為 index 和 column 來指定值
# 使用 map 的方式來賦值
df2 = df1.rename(index=str.lower, columns=str.upper) # 這種方法 照樣是產生一個新的 dataframe
print(df2)
''' 可以很輕鬆的 修改 dataframe 的 index 和 columns
A B C
beijing 0 1 2
shanghai 3 4 5
guangzhou 6 7 8
'''
# 同時,rename 還可以傳入字典
df3 = df2.rename(index={'beijing':'bj'}, columns = {'A':'aa'}) # 為某個 index 單獨修改名稱
print(df3) #
'''
aa B C
bj 0 1 2
shanghai 3 4 5
guangzhou 6 7 8
'''
# 自定義map函式
def test_map(x):
return x+'_ABC'
print(df1.index.map(test_map))
# 輸出 Index(['BEIJING_ABC', 'SHANGHAI_ABC', 'GUANGZHOU_ABC'], dtype='object')
print(df1.rename(index=test_map))
'''
a b c
BEIJING_ABC 0 1 2
SHANGHAI_ABC 3 4 5
GUANGZHOU_ABC 6 7 8
'''