1. 程式人生 > >Python Pandas.DataFrame對Excel操作

Python Pandas.DataFrame對Excel操作

對原文的精簡 感謝原文博主

  • 讀入: 輸出是dataframe
  • import pandas as pd
    excelFile = r’TEMP.xlsx’
    df = pd.DataFrame(pd.read_excel(excelFile))
    print(df)

  • 讀取指定sheet
    def read_excel(io, sheet_name=0, header=0, skiprows=None, skip_footer=0,
    index_col=None, names=None, usecols=None, parse_dates=False,
    date_parser=None, na_values=None, thousands=None,
    convert_float=True, converters=None, dtype=None,
    true_values=None, false_values=None, engine=None,
    squeeze=False, **kwds):

  • 選擇特定列:考慮輸出是dataframe 用其列columns特性
    df1= df[[‘Project Name’, ‘Status’, ‘Offer’, ‘Tax Rate’, ‘PM’]]

  • 定位滿足特定要求資料 同MATLAB下find的感覺
    df2 = df1.loc[df1[‘PM’] == ‘Bob’]

  • 同時滿足多個要求
    -df2 = df1.loc[df1[‘PM’] == ‘Bob’].loc[df1[‘Status’] == ‘Completed’]
    -獲取特定列的值
    pmList = df1[[‘PM’]].values.T.tolist()[:][0] 和前面選特定列有啥不一樣?

  • 寫入Excel表格
    先轉為dataframe 格式 再存 filePath是存放路徑
    summaryDataFrame = pd.DataFrame(sum_list)
    summaryDataFrame.to_excel(filePath, encoding=’utf-8’, index=False, header=False)