pandas DataFrame的修改方法
pandas DataFrame的增刪查改總結系列文章:
- ofollow,noindex" target="_blank">pandas DaFrame的建立方法
- pandas DataFrame的查詢方法
- pandas DataFrame行或列的刪除方法
- pandas DataFrame的修改方法
對於DataFrame的修改操作其實有很多,不單單是某個部分的值的修改,還有一些索引的修改、列名的修改,型別修改等等。我們僅選取部分進行介紹。
一、值的修改
DataFrame的修改方法,其實前面介紹loc方法的時候介紹了一些。
1、 loc方法修改
loc方法實際上是定位某個位置的資料的,但是定位完以後就可以對此位置的資料進行修改,使用此方法可以對DataFrame進行的修改如下:
- 對某行、某N行進行修改;
- 對某列、某N列進行修改;
- 對橫座標為某行或某N行,縱座標為某列或者某N列的資料進行修改;
可以看出基本用loc方法我們對DataFrame可以進行任意修改了。
1.1 對某行、某N行進行修改
# 對第1行進行修改 test_dict_df.loc[1:1,('english','id','math','name')]=[90,2,100,'Alice_m'] # 對第0行到第1行進行修改 test_dict_df.loc[0:1,('english','id','math','name')]=[[90,1,100,'Alice_m'],[70,2,100,'Bob']] # 對第0行和第2行進行修改 test_dict_df.loc[0:3:2,('english','id','math','name')]=[[90,1,100,'Alice_m'],[70,2,100,'Bob']]
可以看出具體的方法就是用loc方法,對某行或者某N行進行定位,然後賦予合適的格式的值就可以了。
1.2 對某列、某N列進行修改
學會了使用loc方法對行的修改,那觸類旁通,對列的修改也很簡單了。對列修改也就是修改此列的所有行。
# 對第english列進行修改 test_dict_df.loc[:,('english')]=[90,80,70,90,90,59] #test_dict_df.loc[:,'english']=[90,80,70,90,90,59] # 對第english列和id列進行修改,注意賦值的寫法 test_dict_df.loc[:,('english','id')]=[[90,1],[80,2],[80,2],[80,2],[80,2],[80,2]]
1.3 對某個區域的值進行修改
# 對第1、2行的english列和 id列進行修改 test_dict_df.loc[1:2,('english','id')]=[[38,2],[23,2]]
1.4總結
可以看到loc方法就是,只要你能選到某個或者某個區域的值,然後就可以對此部分的值進行修改。但是要注意賦值部分的組織方式。
2、 iloc、at、iat方法修改
類比於上面的方式,其實只要能選擇,都是可以修改的。選擇方法可以看pandas DataFrame的查詢(選擇)篇 。
二、列名的修改
1、直接全部更改
這種方法是對DataFrame的列名進行重新賦值,比較暴力直接。
test_dict_df.columns=['english_new','id_new','math_new','name_new']
2、使用rename方法
這種方法是比較推薦的,通過rename方法,注意引數inplace=True的時候,才能真正的在原來的DataFrame上進行修改。
test_dict_df.rename(columns={'english_new':'english'},inplace=True)
三、索引的修改
1、修改索引名稱
上面的rename方法,如果不寫columns=xx
就預設修改索引了 。
test_dict_df.rename({0:'english1'},inplace=True)
2、重置索引
通過reset_index()方法我們可以重置索引,drop引數為True時,直接丟棄原來的索引,否則原來的索引新生成一列名為'index'的列:
test_dict_df.reset_index(inplace=True,drop=True)
2、設定其他列為索引
當然我們也可以用其他列為索引,通過set_index()方法:
test_dict_df.set_index('id_new')
四、總結
可以看到,所謂的修改首先要能選擇修改的位置,即定位,然後對確定好的位置進行重新賦值,所以我們學會了如何選擇資料,也就基本能修改此處的資料。
原始碼:github