1. 程式人生 > >java使用wkhtmltopdf將html或者URI連結生成PDF

java使用wkhtmltopdf將html或者URI連結生成PDF

最近專案有個需求,將客戶提供的URI連結轉化為PDF檔案,原本打算使用itext轉換的,發現使用itext轉化後的PDF格式和html差異過大。後來經同事介紹可以使用wkhtmltopdf對html或URI連結轉化為PDF,經過測試確實很強大,也比較簡單,但是要安裝wkhtmltopdf外掛。

  使用步驟:

        1、下載wkhtmltopdf外掛

            

https://wkhtmltopdf.org/

        2、安裝wkhtmltopdf並配置環境變數

            

    3、測試wkhtmltopdf

        wkhtmltopdf   html地址或URI連結    PDF檔案儲存路徑

        

        生成的PDF檔案如下:

        

 

    4、java呼叫wkhtmltopdf

package com.kurumi.medical.util;

import java.io.BufferedReader;
import java.io.File;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;

public class Html2PDF {

	/**
	 * wkhtmltopdf命令地址
	 */
	private static final String TOPDFTOOL = "C://Program Files//wkhtmltopdf//bin//wkhtmltopdf.exe";

	/**
	 * html轉pdf
	 * 
	 * @param srcPath
	 *            html路徑,可以是硬碟上的路徑,也可以是網路路徑
	 * @param destPath
	 *            pdf儲存路徑
	 * @return 轉換成功返回true
	 */
	public static boolean convert(String srcPath, String destPath) {

		File file = new File(destPath);
		File parent = file.getParentFile();
		// 如果pdf儲存路徑不存在,則建立路徑
		if (!parent.exists()) {
			parent.mkdirs();
		}

		StringBuilder cmd = new StringBuilder();
		cmd.append(TOPDFTOOL);
		cmd.append(" ");
		cmd.append(srcPath);
		cmd.append(" ");

		cmd.append(" --page-size A4");// 設定紙張大小
		cmd.append(destPath);

		boolean result = true;
		try {
			Process proc = Runtime.getRuntime().exec(cmd.toString());
			HtmlToPdfInterceptor error = new HtmlToPdfInterceptor(proc.getErrorStream());
			HtmlToPdfInterceptor output = new HtmlToPdfInterceptor(proc.getInputStream());
			error.start();
			output.start();
			proc.waitFor();
			System.out.println("HTML2PDF成功");
		} catch (Exception e) {
			System.out.println(("HTML2PDF失敗"));
			e.printStackTrace();
			result = false;
		}
		return result;
	}

	public static class HtmlToPdfInterceptor extends Thread {

		private InputStream is;

		public HtmlToPdfInterceptor(InputStream is) {
			this.is = is;
		}

		public void run() {
			try {
				InputStreamReader isr = new InputStreamReader(is, "utf-8");
				BufferedReader br = new BufferedReader(isr);
				br.readLine();
			} catch (IOException e) {
				e.printStackTrace();
			}
		}
	}

	public static void main(String[] args) {
		String htmlPath = "http://www.baidu.com/";
		String pdfPath = "D://testpdf2.pdf";
		Html2PDF.convert(htmlPath, pdfPath);
	}

}

    5、常用引數設定

常規選項 
–allow 允許載入從指定的資料夾中的檔案或檔案(可重複) 
–book* 設定一會列印一本書的時候,通常設定的選項 
–collate 列印多份副本時整理 
–cookie 設定一個額外的cookie(可重複) 
–cookie-jar 讀取和寫入的Cookie,並在提供的cookie jar檔案 
–copies 影印列印成pdf檔案數(預設為1) 
–cover* 使用HTML檔案作為封面。它會帶頁首和頁尾的TOC之前插入 
–custom-header 設定一個附加的HTTP頭(可重複) 
–debug-javascript 顯示的javascript除錯輸出 
–default-header* 新增一個預設的頭部,與頁面的左邊的名稱,頁面數到右邊,例如: –header-left ‘[webpage]’ –header-right ‘[page]/[toPage]’ –header-line 
–disable-external-links* 禁止生成連結到遠端網頁 
–disable-internal-links* 禁止使用本地連結 
–disable-javascript 禁止讓網頁執行JavaScript 
–disable-pdf-compression* 禁止在PDF物件使用無失真壓縮 
–disable-smart-shrinking* 禁止使用WebKit的智慧戰略收縮,使畫素/ DPI比沒有不變 
–disallow-local-file-access 禁止允許轉換的本地檔案讀取其他本地檔案,除非explecitily允許用 –allow 
–dpi 顯式更改DPI(這對基於X11的系統沒有任何影響) 
–enable-plugins 啟用已安裝的外掛(如Flash 
–encoding 設定預設的文字編碼 
–extended-help 顯示更廣泛的幫助,詳細介紹了不常見的命令開關 
–forms* 開啟HTML表單欄位轉換為PDF表單域 
–grayscale PDF格式將在灰階產生 
–help Display help 
–htmldoc 輸出程式HTML幫助 
–ignore-load-errors 忽略claimes載入過程中已經遇到了一個錯誤頁面 
–lowquality 產生低品質的PDF/ PS。有用縮小結果文件的空間 
–manpage 輸出程式手冊頁 
–margin-bottom 設定頁面下邊距 (default 10mm) 
–margin-left 將左邊頁邊距 (default 10mm) 
–margin-right 設定頁面右邊距 (default 10mm) 
–margin-top 設定頁面上邊距 (default 10mm) 
–minimum-font-size 最小字型大小 (default 5) 
–no-background 不列印背景 
–orientation 設定方向為橫向或縱向 
–page-height 頁面高度 (default unit millimeter) 
–page-offset* 設定起始頁碼 (default 1) 
–page-size 設定紙張大小: A4, Letter, etc. 
–page-width 頁面寬度 (default unit millimeter) 
–password HTTP驗證密碼 
–post Add an additional post field (repeatable) 
–post-file Post an aditional file (repeatable) 
–print-media-type* 使用的列印介質型別,而不是螢幕 
–proxy 使用代理 
–quiet Be less verbose 
–read-args-from-stdin 讀取標準輸入的命令列引數 
–readme 輸出程式自述 
–redirect-delay 等待幾毫秒為JS-重定向(default 200) 
–replace* 替換名稱,值的頁首和頁尾(可重複) 
–stop-slow-scripts 停止執行緩慢的JavaScripts 
–title 生成的PDF檔案的標題(第一個文件的標題使用,如果沒有指定) 
–toc* 插入的內容的表中的檔案的開頭 
–use-xserver* 使用X伺服器(一些外掛和其他的東西沒有X11可能無法正常工作) 
–user-style-sheet 指定使用者的樣式表,載入在每一頁中 
–username HTTP認證的使用者名稱 
–version 輸出版本資訊退出 
–zoom 使用這個縮放因子 (default 1)

頁首和頁尾選項 
–header-center* (設定在中心位置的頁首內容) 
–header-font-name* (default Arial) (設定頁首的字型名稱) 
–header-font-size* (設定頁首的字型大小) 
–header-html* (新增一個HTML頁首,後面是網址) 
–header-left* (左對齊的頁首文字) 
–header-line* (顯示一條線在頁首下) 
–header-right* (右對齊頁首文字) 
–header-spacing* (設定頁首和內容的距離,預設0) 
–footer-center* (設定在中心位置的頁尾內容) 
–footer-font-name* (設定頁尾的字型名稱) 
–footer-font-size* (設定頁尾的字型大小default 11) 
–footer-html* (新增一個HTML頁尾,後面是網址) 
–footer-left* (左對齊的頁尾文字) 
–footer-line* 顯示一條線在頁尾內容上) 
–footer-right* (右對齊頁尾文字) 
–footer-spacing* (設定頁尾和內容的距離) 
./wkhtmltopdf –footer-right ‘[page]/[topage]’ http://www.baidu.com baidu.pdf 
./wkhtmltopdf –header-center ‘報表’ –header-line –margin-top 2cm –header-line http://192.168.212.139/oma/ oma.pdf 
表內容選項中 
–toc-depth* Set the depth of the toc (default 3) 
–toc-disable-back-links* Do not link from section header to toc 
–toc-disable-links* Do not link from toc to sections 
–toc-font-name* Set the font used for the toc (default Arial) 
–toc-header-font-name* The font of the toc header (if unset use –toc-font-name) 
–toc-header-font-size* The font size of the toc header (default 15) 
–toc-header-text* The header text of the toc (default Table Of Contents) 
–toc-l1-font-size* Set the font size on level 1 of the toc (default 12) 
–toc-l1-indentation* Set indentation on level 1 of the toc (default 0) 
–toc-l2-font-size* Set the font size on level 2 of the toc (default 10) 
–toc-l2-indentation* Set indentation on level 2 of the toc (default 20) 
–toc-l3-font-size* Set the font size on level 3 of the toc (default 8) 
–toc-l3-indentation* Set indentation on level 3 of the toc (default 40) 
–toc-l4-font-size* Set the font size on level 4 of the toc (default 6) 
–toc-l4-indentation* Set indentation on level 4 of the toc (default 60) 
–toc-l5-font-size* Set the font size on level 5 of the toc (default 4) 
–toc-l5-indentation* Set indentation on level 5 of the toc (default 80) 
–toc-l6-font-size* Set the font size on level 6 of the toc (default 2) 
–toc-l6-indentation* Set indentation on level 6 of the toc (default 100) 
–toc-l7-font-size* Set the font size on level 7 of the toc (default 0) 
–toc-l7-indentation* Set indentation on level 7 of the toc (default 120) 
–toc-no-dots* Do not use dots, in the toc 
輪廓選項 
–dump-outline 轉儲目錄到一個檔案 
–outline 顯示目錄(文章中h1,h2來定) 
–outline-depth 設定目錄的深度(預設為4) 
頁尾和頁首 
* [page] 由當前正在列印的頁的數目代替 
* [frompage] 由要列印的第一頁的數量取代 
* [topage] 由最後一頁要列印的數量取代 
* [webpage] 通過正在列印的頁面的URL替換 
* [section] 由當前節的名稱替換 
* [subsection] 由當前小節的名稱替換 
* [date] 由當前日期系統的本地格式取代 
* [time] 由當前時間,系統的本地格式取代