1. 程式人生 > >使用python把html網頁轉成pdf檔案

使用python把html網頁轉成pdf檔案

我們看到一些比較寫的比較好文章或者部落格的時候,想儲存下來到本地當一個pdf檔案,當做自己的知識儲備,以後即使這個部落格或者文章的連線不存在了,或者被刪掉,咱們自己也還有。

當然咱們作為一個coder,這樣的事情肯定不能手動儲存下來然後再轉成pdf存起來對不對,有失咱們碼農的身份,當然要自動化的來實現了~

 

準備工作

 

 

那怎麼辦呢,python裡面有個模組是pdfkit,他可以幫咱們把一個html(也就是一個網頁)變成一個pdf檔案。

pdfkit是python對wkhtmltopdf這個把網頁轉成pdf工具的一個封裝,所以咱們必須得先安裝一個wkhtmltopdf,這個工具的下載網站是:https://wkhtmltopdf.org/downloads.html,根據自己的作業系統下載對應的版本即可。ps:這裡要記住安裝目錄啊,下面要用到它,不要忘記它的安裝目錄~

上面說到了pdfkit這個模組,這個是第三方模組,需要安裝,使用pip安裝即可。

 
1 pip install pdfkit

 

 

寫程式碼實現

 

 

pdfkit它給咱們提供了很多功能,可以給它一個url,他會自動獲取url裡面的內容,幫你儲存好,也可以給他一個html檔案,也可以儲存,也可以給他一個字串,也可以儲存成pdf,下面是程式碼:

 
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 import pdfkit   url='https://www.cnblogs.com/sriba/p/8043294.html'#一篇部落格的url confg = pdfkit.configuration(wkhtmltopdf='C:\Python35\wkhtmltopdf.exe') #這裡指定一下wkhtmltopdf的路徑,這就是我為啥在前面讓記住這個路徑 pdfkit.from_url(url, 'jmeter_下載檔案.pdf',configuration=confg) # from_url這個函式是從url裡面獲取內容 # 這有3個引數,第一個是url,第二個是檔名,第三個就是khtmltopdf的路徑   #pdfkit.from_file('my.html', 'jmeter_下載檔案2.pdf',configuration=confg) # from_file這個函式是從檔案裡面獲取內容 # 這有3個引數,第一個是一個html檔案,第二個是文生成的pdf的名字,第三個就是khtmltopdf的路徑   html=''' <div> <h1>title</h1> <p>content</p> </div> '''#這個html是我從一個頁面上拷下來的一段,也可以   #pdfkit.from_string(html, 'jmeter_下載檔案3.pdf',configuration=confg) # from_file這個函式是從一個字串裡面獲取內容 # 這有3個引數,第一個是一個字串,第二個是文生成的pdf的名字,第三個就是khtmltopdf的路徑

下面是儲存好的pdf檔案,是不是很簡單,快去試試吧