利用 Python 進行資料分析(十二)pandas:資料合併
阿新 • • 發佈:2019-01-10
pandas 提供了三種主要方法可以對資料進行合併:
剛剛的三個合併都是以列名作為連線鍵,DataFrame還有一個join()方法可以以索引作為連線鍵
例如:
pandas.concat()方法:軸向連線,即沿著一條軸將多個物件堆疊到一起
例如:
預設情況下,concat在豎軸(axis=0)上連線,即產生一個新的Series。如果想要在橫軸方向連線,則傳入axis=1,例如:
例項方法combine_first()方法:合併重疊資料
例如:
這個方法等價與:
它做的是一個向量化的if-else操作,如果s1裡某個位置上的資料為空,則用s2同位置上的元素來補,你可以理解為“打補丁”操作。
- pandas.merge()方法:資料庫風格的合併;
- pandas.concat()方法:軸向連線,即沿著一條軸將多個物件堆疊到一起;
- 例項方法combine_first()方法:合併重疊資料。