1. 程式人生 > >python-嘗試將Excel文件保存為圖片並加上水印

python-嘗試將Excel文件保存為圖片並加上水印

缺陷 white 導出 nms lsb Coding hrp 場景 phantom

python-嘗試將Excel文件保存為圖片並加上水印

場景:並不是將 excel 的 chart 生成圖片,而是將整個表格內容生成圖片。

1. 準備工作

目前搜索不到已有的方法,只能自己嘗試寫一個,想法有兩個:

  1. 通過 Python 的圖片處理庫PIL,將 Excel 內信息逐寫到圖片上;

  2. 通過另存為 HTML 文件,利用Phantomjs的截圖工具,截取到 HTML 。比較曲折的方法,但可能更容易上手。

我選擇了後者,雖然每一步都不太熟練,但是先逐個擊破吧!

2. Excel to HTML

2.1 嘗試直接另存為 HTML 不成功

這一步參考 [How do I save Excel Sheet as HTML in Python?
]https://stackoverflow.com/questions/19631511/how-do-i-save-excel-sheet-as-html-in-python ,
需要先在 excel 裏編輯好一個

,再運行如下代碼:

from win32com.client import Dispatch

xl = Dispatch(‘Excel.Application‘)
xl.Workbooks.Open(‘C:\Foo\Bar.xlsx‘)
#xl.Visible = True -- optional
xl.Application.Run("SaveHTML")
xl.Workbooks.Close

使用上面的代碼報錯,信息如下:

com_error: (-2147352567, ‘發生意外。‘, (0, ‘Microsoft Excel‘, ‘無法運行“SaveHTML”宏。可能是因為該宏在此工作簿中不可用,或者所有的宏都被禁用。‘, ‘xlmain11.chm‘, 0, -2146827284), None)

我因為需要大量生成 Excel,覺得這個方法不太適合我,就跳過了。

2.2 使用 Python 編輯現成的 html 模板,再修改自己需要的信息。

需要用到selenium3chromedriver和對應的 Chrome 版本。https://www.cnblogs.com/technologylife/p/5829944.html
一個簡短的截圖程序:

from selenium import webdriver
from selenium.webdriver.chrome.options import Options

chrome_options = Options()
chrome_options.add_argument(‘--headless‘
) #無界面 chrome_options.add_argument(‘--disable-gpu‘) br = webdriver.Chrome(chrome_options=chrome_options) #實例化瀏覽器 br.set_window_size(1024,700) #設置窗口大小 br.get(‘F:/file.htm‘) br.get_screenshot_as_file("F:\\file.png") br.quit() #退出很重要

3. 修改 HTML 文件

這裏需要本地打開一個html文件,修改後再用瀏覽器打開。

3.1 遇到編碼轉碼問題

我的HTML文件編碼是’gb2312’,這是Excel2010導出的默認編碼。我用Python打開這個文件一直報錯!

UnicodeDecodeError: ‘ascii‘ codec can‘t decode byte 0xe5 in position 4: ordinal not in range

前後折騰了10個小時!一直在decode encode!其實根本不是這個問題!問題只是:
千萬不要有中文文件名和路徑!
都被自己的愚蠢驚到了。只要做到這樣,再配合這句:

#打開
data = open("F://ktd.htm","r").read().decode("gb2312","ignore")
#保存
f = open(‘F:/data.htm‘,‘w‘)
f.write(data.encode("gb2312","ignore"))
f.close()

基本就搞定了。

3.2 使用beautifulsoup修改網頁

棄療,即使有修改網頁字符串的方式,我也發現太難找到我需要修改的元素,因為它不支持xpath定位。因此我直接用字符串的replace方式。

4. 控制Google瀏覽器截圖

code:

# -*- coding: utf-8 -*-
"""
Created on Tue Jan 30 21:00:45 2018

@author: xglc
"""
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from PIL import Image

chrome_options = Options()
#chrome_options.add_argument(‘--headless‘) #無頭
#chrome_options.add_argument(‘--disable-gpu‘)

br = webdriver.Chrome(chrome_options=chrome_options)
br.set_window_size(950,830)

def _pic(name):

    br.get(‘F:/zqht/%s.htm‘%name)
    # 截取當前窗口,並指定截圖圖片的保存位置
    path = ‘F:/ktd/new/%s.png‘%(name) 
    br.get_screenshot_as_file(path)   
    _sy(path) 

#    br.quit()
def _sy(path):
    lp = Image.open(path)  
    tp = Image.open(‘F:/work/zq/zqz.gif‘)  #水印

#    rgba_image = lp.convert(‘RGBA‘)
#    rgba_watermark = tp.convert(‘RGBA‘)
    img = tp.convert(‘RGBA‘) 
    r, g, b, alpha = img.split()  
    alpha = alpha.point(lambda i: i>0 and 240)  
    img.putalpha(alpha)  

    image_x, image_y = lp.size
    watermark_x, watermark_y = tp.size

    # 水印位置  mask是通道值,240+ 是透明效果
    lp.paste(img, (image_x - watermark_x, image_y - watermark_y),mask = alpha)
    print (‘保存圖片‘) 
    lp.save(‘F:/lala.png‘,"PNG") 

if __name__ == ‘__main__‘:
    name = ‘bgs‘
    _pic(name)
  1. 通過調整瀏覽器窗口來控制截圖大小,效果還不錯。目前已知缺陷是,還沒協調好被調用時候的內存使用問題,可能直接生成一個alpha通道值為240的圖片,更節省資源。

  2. 這麽一搞,有時候保存個中文路徑或者圖片也做不到了。可能跟前面的編解碼有關。

?

python-嘗試將Excel文件保存為圖片並加上水印