1. 程式人生 > >pandas DataFrame的修改方法

pandas DataFrame的修改方法

pandas DataFrame的增刪查改總結系列文章:

對於DataFrame的修改操作其實有很多,不單單是某個部分的值的修改,還有一些索引的修改、列名的修改,型別修改等等。我們僅選取部分進行介紹。

一、值的修改

DataFrame的修改方法,其實前面介紹loc方法的時候介紹了一些。

1、 loc方法修改

loc方法實際上是定位某個位置的資料的,但是定位完以後就可以對此位置的資料進行修改,使用此方法可以對DataFrame進行的修改如下:

  1. 對某行、某N行進行修改;
  2. 對某列、某N列進行修改;
  3. 對橫座標為某行或某N行,縱座標為某列或者某N列的資料進行修改;

可以看出基本用loc方法我們對DataFrame可以進行任意修改了。

1.1 對某行、某N行進行修改

# 對第1行進行修改
test_dict_df.loc[1:1,('english','id','math','name')]=[90,2,100,'Alice_m']
# 對第0行到第1行進行修改
test_dict_df.loc[0:1,('english','id','math','name')]=[[90,1,100,'Alice_m'],[70,2,100,'Bob']]
# 對第0行和第2行進行修改
test_dict_df.loc[0:3:2,('english','id','math','name')]=[[90,1,100,'Alice_m'],[70,2,100,'Bob']]

可以看出具體的方法就是用loc方法,對某行或者某N行進行定位,然後賦予合適的格式的值就可以了。

1.2 對某列、某N列進行修改

學會了使用loc方法對行的修改,那觸類旁通,對列的修改也很簡單了。對列修改也就是修改此列的所有行。

# 對第english列進行修改
test_dict_df.loc[:,('english')]=[90,80,70,90,90,59] #test_dict_df.loc[:,'english']=[90,80,70,90,90,59]
# 對第english列和id列進行修改,注意賦值的寫法
test_dict_df.loc[:,('english','id')]=[[90,1],[80,2],[80,2],[80,2],[80,2],[80,2]]

1.3 對某個區域的值進行修改

# 對第1、2行的english列和 id列進行修改
test_dict_df.loc[1:2,('english','id')]=[[38,2],[23,2]]

1.4總結

可以看到loc方法就是,只要你能選到某個或者某個區域的值,然後就可以對此部分的值進行修改。但是要注意賦值部分的組織方式。

2、 iloc、at、iat方法修改

二、列名的修改

1、直接全部更改

這種方法是對DataFrame的列名進行重新賦值,比較暴力直接。

test_dict_df.columns=['english_new','id_new','math_new','name_new']

2、使用rename方法

這種方法是比較推薦的,通過rename方法,注意引數inplace=True的時候,才能真正的在原來的DataFrame上進行修改。

test_dict_df.rename(columns={'english_new':'english'},inplace=True)

三、索引的修改

1、修改索引名稱

上面的rename方法,如果不寫columns=xx就預設修改索引了 。

test_dict_df.rename({0:'english1'},inplace=True)

2、重置索引

通過reset_index()方法我們可以重置索引,drop引數為True時,直接丟棄原來的索引,否則原來的索引新生成一列名為'index'的列:

test_dict_df.reset_index(inplace=True,drop=True)

2、設定其他列為索引

當然我們也可以用其他列為索引,通過set_index()方法:

test_dict_df.set_index('id_new')

四、總結

可以看到,所謂的修改首先要能選擇修改的位置,即定位,然後對確定好的位置進行重新賦值,所以我們學會了如何選擇資料,也就基本能修改此處的資料。