1. 程式人生 > >pandas中DataFrame修改index、columns名的方法

pandas中DataFrame修改index、columns名的方法

一般常用的有兩個方法:
1、使用DataFrame.index = [newName],DataFrame.columns = [newName],這兩種方法可以輕鬆實現。
2、使用rename方法(推薦):
DataFrame.rename(mapper = None,index = None,columns = None,axis = None,copy = True,inplace = False,level = None )
引數介紹:
mapper,index,columns:可以任選其一使用,可以是將index和columns結合使用。index和column直接傳入mapper或者字典的形式。
axis:int或str,與mapper配合使用。可以是軸名稱(‘index’,‘columns’)或數字(0,1)。預設為’index’。
copy:boolean,預設為True,是否複製基礎資料。
inplace:布林值,預設為False,是否返回新的DataFrame。如果為True,則忽略複製值。

import numpy as np
import pandas as pd
from pandas import Series, DataFrame

df1 = DataFrame(np.arange(9).reshape(3, 3), index = ['bj', 'sh', 'gz'], columns=['a', 'b', 'c'])
print(df1)
'''
    a  b  c
bj  0  1  2
sh  3  4  5
gz  6  7  8
'''

# 修改 df1 的 index
print(df1.index) # 可以打印出print的值,同時也可以為其賦值
df1.index = Series(['beijing', 'shanghai', 'guangzhou']) print(df1) ''' a b c beijing 0 1 2 shanghai 3 4 5 guangzhou 6 7 8 ''' # 可以使用map方法進行對映,map的使用方法就和python中的map幾乎一樣 print(df1.index.map(str.upper)) # Index(['BEIJING', 'SHANGHAI', 'GUANGZHOU'], dtype='object') print(df1)
# 結果 並未改變, 上面只是返回一個 dataframe 而已 ''' a b c beijing 0 1 2 shanghai 3 4 5 guangzhou 6 7 8 ''' # 如果 需要 改變的話,可以如下: 另外賦值給一個變數 df1.index = df1.index.map(str.upper) print(df1) # 這樣 就 改變了 ''' a b c BEIJING 0 1 2 SHANGHAI 3 4 5 GUANGZHOU 6 7 8 ''' # 更快捷的 方法 使用 rename,可以分別為 index 和 column 來指定值 # 使用 map 的方式來賦值 df2 = df1.rename(index=str.lower, columns=str.upper) # 這種方法 照樣是產生一個新的 dataframe print(df2) ''' 可以很輕鬆的 修改 dataframe 的 index 和 columns A B C beijing 0 1 2 shanghai 3 4 5 guangzhou 6 7 8 ''' # 同時,rename 還可以傳入字典 df3 = df2.rename(index={'beijing':'bj'}, columns = {'A':'aa'}) # 為某個 index 單獨修改名稱 print(df3) # ''' aa B C bj 0 1 2 shanghai 3 4 5 guangzhou 6 7 8 ''' # 自定義map函式 def test_map(x): return x+'_ABC' print(df1.index.map(test_map)) # 輸出 Index(['BEIJING_ABC', 'SHANGHAI_ABC', 'GUANGZHOU_ABC'], dtype='object') print(df1.rename(index=test_map)) ''' a b c BEIJING_ABC 0 1 2 SHANGHAI_ABC 3 4 5 GUANGZHOU_ABC 6 7 8 '''