python資料分析工具pandas作業:合併excel重複行
python資料分析工具pandas作業:合併excel重複行
工作中經常有些資料,從多個EXCEL表中彙總後,會出現同一專案多條記錄的情況,需要合併這些對應的記錄。
資料示例:
下圖中,我們state和year能確定一個專案,但是有2條記錄,我們需要把對應記錄的pop值相加。

圖片.png
程式碼
#!/usr/bin/python3 # -*- coding: utf-8 -*- # 技術支援:https://www.jianshu.com/u/69f40328d4f0 # 技術支援 https://china-testing.github.io/merge_excel_rows.html # https://github.com/china-testing/python-api-tesing/blob/master/practices/pandas/merge_excel_rows.py # 專案實戰討論QQ群630011153 144081101 # CreateDate: 2018-12-06 import pandas as pd frame = pd.read_csv("test.csv") df =frame.groupby(['state', 'year']).sum() df.to_csv("out.csv")
輸出的out.csv如下:

圖片.png