1. 程式人生 > >用Python這樣操作Excel?值得一學,總有一天用得上

用Python這樣操作Excel?值得一學,總有一天用得上

 

最近一直在做專案裡的自動化的工作,為了是從繁瑣重複的勞動中掙脫出來,把精力用在資料分析上。自動化方面python是在好不過了,不過既然要提交報表,就不免要美觀什麼的。pandas雖然很強大,但是無法對Excel完全操作,現學vba有點來不及。

 

 

於是就找到這個openpyxl包,用python來修改Excel,礙於水平有限,琢磨了兩天,踩了不少坑,好在完成了自動化工作(以後起碼多出來幾個小時,美滋滋)。

在這裡寫下這兩天的筆記和踩得坑,方面新手躲坑,也供自己日後查閱。如有問題,還請見諒並指出,多謝。

 
1from openpyxl import load_workbook 2from openpyxl.styles import colors, Font, Fill, NamedStyle 3from openpyxl.styles import PatternFill, Border, Side, Alignment 4 5# 載入檔案 6wb = load_workbook('./5a.xlsx') 

 

  • workbook: 工作簿,一個excel檔案包含多個sheet。
  • worksheet:工作表,一個workbook有多個,表名識別,如“sheet1”,“sheet2”等。
  • cell: 單元格,儲存資料物件

文章所用表格為:

 

 

操作sheet

 
1# 讀取sheetname 2print('輸出檔案所有工作表名:\n', wb.sheetnames) 3ws = wb['5a'] 4 5# 或者不知道名字時 6sheet_names = wb.sheetnames 7ws2 = wb[sheet_names[0]] # index為0為第一張表 8print(ws is ws2) 

 

輸出檔案所有工作表名:

['5a']

True

 
1# 修改sheetname 2 3ws.title = '5a_' 4print('修改sheetname:\n', wb.sheetnames) 

 

修改sheetname:

['5a_']

 
1# 建立新的sheet 2# 建立的新表必須要賦值給一個物件,不然只有名字但是沒有實際的新表 3 4ws4 = wb.create_sheet(index=0, title='newsheet') 5# 什麼引數都不寫的話,預設插入到最後一個位置且名字為sheet,sheet1...按照順序排列 6 7ws5 = wb.create_sheet() 8print('建立新的sheet:\n', wb.sheetnames) 

 

建立新的sheet:

['newsheet', '5a_', 'Sheet']

 
1# 刪除sheet 2wb.remove(ws4) # 這裡只能寫worksheet物件,不能寫sheetname 3print('刪除sheet:\n', wb.sheetnames) 

刪除sheet:

['5a_', 'Sheet']

 
1# 修改sheet選項卡背景色,預設為白色,設定為RRGGBB模式 2ws.sheet_properties.tabColor = "FFA500" 3 4# 讀取有效區域 5 6print('最大列數為:', ws.max_column) 7print('最大行數為:', ws.max_row) 

最大列數為: 5

最大行數為: 17

 
1# 插入行和列 2ws.insert_rows(1) # 在第一行插入一行 3ws.insert_cols(2, 4) # 從第二列開始插入四列 4 5# 刪除行和列 6ws.delete_cols(6, 3) # 從第六列(F列)開始,刪除3列即(F:H) 7ws.delete_rows(3) # 刪除第三行 

 

單元格操作

 
1# 讀取 2c = ws['A1'] 3c1 = ws.cell(row=1, column=2) 4print(c, c1) 5print(c.value, c1.value) 

<Cell '5a_'.A1> <Cell '5a_'.B1>

dth_title Province

 
1# 修改 2ws['A1'] = '景區名稱' 3ws.cell(1, 2).value = '省份' 4print(c.value, c1.value) 

景區名稱 省份

 
1# 讀取多個單元格 2 3cell_range = ws['A1:B2'] 4colC = ws['C'] 5col_range = ws['C:D'] 6row10 = ws[10] 7row_range = ws[5:10] 8# 其返回的結果都是一個包含單元格的元組 9cell_range 10# 注意!! 這裡是兩層元組巢狀,每一行的單元格位於同一個元組裡。 

((<Cell '5a_'.A1>, <Cell '5a_'.B1>), (<Cell '5a_'.A2>, <Cell '5a_'.B2>))

 
1# 按照行列操作 2for row in ws.iter_rows(min_row=1, max_row=3, 3 min_col=1, max_col=2): 4 for cell in row: 5 print(cell) 6# 也可以用worksheet.iter_col(),用法都一樣 

<Cell '5a_'.A1>

<Cell '5a_'.B1>

<Cell '5a_'.A2>

<Cell '5a_'.B2>

<Cell '5a_'.A3>

<Cell '5a_'.B3>

 
1# 合併單元格 2ws.merge_cells('F1:G1') 3ws['F1'] = '合併兩個單元格' 4# 或者 5ws.merge_cells(start_row=2, start_column=6, end_row=3, end_column=8) 6ws.cell(2, 6).value = '合併三個單元格' 7 8# 取消合併單元格 9ws.unmerge_cells('F1:G1') 10# 或者 11ws.unmerge_cells(start_row=2, start_column=6, end_row=3, end_column=8) 12 13wb.save('./5a.xlsx') 14# 儲存之前的操作,儲存檔案時,檔案必須是關閉的!!! 

注意!!!,openpyxl對Excel的修改並不像是xlwings一樣是實時的,他的修改是暫時儲存在記憶體中的,所以當後面的修改例如我接下來要在第一行插入新的一行做標題,那麼當我對新的A1單元格操作的時候,還在記憶體中的原A1(現在是A2)的單元格,原有的修改就會被覆蓋。所以要先儲存,或者從一開始就計劃好更改操作避免這樣的事情發生。(別問我怎麼知道的,都是淚o(╥﹏╥)o)

樣式修改

單個單元格樣式

 
1wb = load_workbook('./5a.xlsx') # 讀取修改後的檔案 2ws = wb['5a_'] 3# 我們來設定一個表頭 4ws.insert_rows(1) # 在第一行插入新的一行 5ws.merge_cells('A1:E1') # 合併單元格 6a1 = ws['A1'] 7ws['A1'] = '5A級風景區名單' 8 9# 設定字型 10ft = Font(name='微軟雅黑', color='000000', size=15, b=True) 11""" 12name:字型名稱 13color:顏色通常是RGB或aRGB十六進位制值 14b(bold):加粗(bool) 15i(italic):傾斜(bool) 16shadow:陰影(bool) 17underline:下劃線(‘doubleAccounting’, ‘single’, ‘double’, ‘singleAccounting’) 18charset:字符集(int) 19strike:刪除線(bool) 20""" 21a1.font = ft 22 23# 設定文字對齊 24 25ali = Alignment(horizontal='center', vertical='center') 26""" 27horizontal:水平對齊('centerContinuous', 'general', 'distributed', 28 'left', 'fill', 'center', 'justify', 'right') 29vertical:垂直對齊('distributed', 'top', 'center', 'justify', 'bottom') 30 31""" 32a1.alignment = ali 33 34# 設定圖案填充 35 36fill = PatternFill('solid', fgColor='FFA500') 37# 顏色一般使用十六進位制RGB 38# 'solid'是圖案填充型別,詳細可查閱文件 39 40a1.fill = fill 

openpyxl.styles.fills模組引數文件

 
1# 設定邊框 2bian = Side(style='medium', color='000000') # 設定邊框樣式 3""" 4style:邊框線的風格{'dotted','slantDashDot','dashDot','hair','mediumDashDot', 5 'dashed','mediumDashed','thick','dashDotDot','medium', 6 'double','thin','mediumDashDotDot'} 7""" 8 9border = Border(top=bian, bottom=bian, left=bian, right=bian) 10""" 11top(上),bottom(下),left(左),right(右):必須是 Side型別 12diagonal: 斜線 side型別 13diagonalDownd: 右斜線 bool 14diagonalDown: 左斜線 bool 15""" 16 17# a1.border = border 18for item in ws['A1:E1'][0]: # 去元組中的每一個cell更改樣式 19 item.border = border 20 21wb.save('./5a.xlsx') # 儲存更改 

再次注意!!!:

  • 不能使用 a1.border = border,否則只會如下圖情況,B1:E1單元格沒有線。我個人認為是因為線框涉及到相鄰單元格邊框的改動所以需要單獨對每個單元格修改才行。
  • 不能使用ws['A1:E1'].border = border,由前面的內容可知,openpyxl的多個單元格其實是一個元組,而元組是沒有style的方法的,所以必須一個一個改!!其實官方有其他辦法,後面講。

 

 

只有A1邊框有加粗

按列或行設定樣式

 
1# 現在我們對整個表進行設定 2 3# 讀取 4wb = load_workbook('./5a.xlsx') 5ws = wb['5a_'] 6 7# 讀取資料表格範圍 8rows = ws.max_row 9cols = ws.max_column 10 11# 字型 12font1 = Font(name='微軟雅黑', size=11, b=True) 13font2 = Font(name='微軟雅黑', size=11) 14 15# 邊框 16line_t = Side(style='thin', color='000000') # 細邊框 17line_m = Side(style='medium', color='000000') # 粗邊框 18border1 = Border(top=line_m, bottom=line_t, left=line_t, right=line_t) 19# 與標題相鄰的邊設定與標題一樣 20border2 = Border(top=line_t, bottom=line_t, left=line_t, right=line_t) 21 22# 填充 23fill = PatternFill('solid', fgColor='CFCFCF') 24 25# 對齊 26alignment = Alignment(horizontal='center', vertical='center') 27 28# 將樣式打包命名 29sty1 = NamedStyle(name='sty1', font=font1, fill=fill, 30 border=border1, alignment=alignment) 31sty2 = NamedStyle(name='sty2', font=font2, border=border2, alignment=alignment) 32 33for r in range(2, rows+1): 34 for c in range(1, cols): 35 if r == 2: 36 ws.cell(r, c).style = sty1 37 else: 38 ws.cell(r, c).style = sty2 39 40wb.save('./5a.xlsx') 

 

 

對於,設定標題樣式,其實官方也給出了一個自定義函式(連結閱讀原文),設定範圍後,範圍內的單元格都會合並,並且應用樣式,就像是單個cell一樣。在這裡就不多贅述了,有興趣的可以看看。很實用。