1. 程式人生 > >利用 Python 進行資料分析(十二)pandas:資料合併

利用 Python 進行資料分析(十二)pandas:資料合併

原文地址

pandas 提供了三種主要方法可以對資料進行合併:
  • pandas.merge()方法:資料庫風格的合併;
  • pandas.concat()方法:軸向連線,即沿著一條軸將多個物件堆疊到一起;
  • 例項方法combine_first()方法:合併重疊資料。
pandas.merge()方法:資料庫風格的合併 例如,通過merge()方法將兩個DataFrame合併: on='name'的意思是將name列當作鍵; 預設情況下,merge做的是內連線(inner),即鍵的交集。 其他方式還有左連線(left),右連線(right)和外連線(outer)。例如將剛剛的合併指定為左連線: 再試試外連線,結果取鍵的並集:
剛剛的三個合併都是以列名作為連線鍵,DataFrame還有一個join()方法可以以索引作為連線鍵 例如: pandas.concat()方法:軸向連線,即沿著一條軸將多個物件堆疊到一起 例如: 預設情況下,concat在豎軸(axis=0)上連線,即產生一個新的Series。如果想要在橫軸方向連線,則傳入axis=1,例如: 例項方法combine_first()方法:合併重疊資料 例如: 這個方法等價與: 它做的是一個向量化的if-else操作,如果s1裡某個位置上的資料為空,則用s2同位置上的元素來補,你可以理解為“打補丁”操作。