1. 程式人生 > >手把手教你用 Spring Boot搭建一個線上檔案預覽系統!支援ppt、doc等多種型別檔案預覽

手把手教你用 Spring Boot搭建一個線上檔案預覽系統!支援ppt、doc等多種型別檔案預覽

> 昨晚搭建環境都花了好一會時間,主要在浪費在了安裝 openoffice 這個依賴環境上(_Mac 需要手動安裝_)。 > > 然後,又一步一步功能演示,記錄,除錯專案,並且簡單研究了一下核心程式碼之後才把這篇文章寫完。 > > 另外,這篇文章我還會簡單分析一下專案核心程式碼。 > > _如果有幫助,歡迎點贊/再看鼓勵,我會開心很久 ღ( ´・ᴗ・` )比心_ ## 專案介紹 官方是這樣介紹 kkFileView 的: > kkFileView 是使用 spring boot 打造檔案文件線上預覽專案解決方案,支援 doc、docx、ppt、pptx、xls、xlsx、zip、rar、mp4、mp3 以及眾多類文字如 txt、html、xml、java、properties、sql、js、md、json、conf、ini、vue、php、py、bat、gitignore 等檔案線上預覽 **簡單來說 kkFileView 就是常見的檔案型別的線上預覽解決方案。** 總的來說我覺得 kkFileView 是一個非常棒的開源專案,線上檔案預覽這個需求非常常見。感謝開源! 下面, 我站在一個“上帝”的角度從多個維度來評價一下 kkFileView: 1. 程式碼質量一般,有很多可以優化的地方比如: - `Controller` 層程式碼巢狀太多邏輯 - 沒有進行全域性異常處理(_程式碼中是直接返回錯誤資訊的 json 資料給前端,我並不推薦這樣做_) - 返回值不需要通過`ObjectMapper`轉換為 JSON 格式(`ResponseEntity`+`@RestController` 就行了) - ...... 2. 使用的公司比較多,說明專案整體功能還是比較穩定和成熟的! 3. 程式碼整體邏輯還是比較清晰的,比較容易看懂,給作者們點個贊! ## 環境搭建 ### 克隆專案 通過以下命令即可將專案克隆到本地: ```bash git clone https://gitee.com/kekingcn/file-online-preview.git ``` ### 安裝 OpenOffice office 型別的檔案的預覽依賴了 OpenOffice ,所以我們首先要安裝 OpenOffice(Windows 下已內建,Linux 會自動安裝,Mac OS 下需要手動安裝)。 下面演示一下如何在 Mac 上安裝 OpenOffice。 你可以通過以下命令安裝最新版的 OpenOffice: ```bash brew cask install openoffice ``` 不過,這種方式下載可能會比較慢,你可以直接去官網下載 dmg 安裝包。 官方下載地址:[https://www.openoffice.org/download/](https://www.openoffice.org/download/) ![OpenOffice下載 ](https://img2020.cnblogs.com/other/1843652/202010/1843652-20201015194332310-1663417675.png) 很多小夥伴就要問了:**OpenOffice 是什麼呢?** [OpenOffice](https://www.openoffice.org/) 是 Apache 旗下的一款開源免費的文書處理軟體,支援 Windows、Liunx、OS X 等主流作業系統。 OpenOffice 和 Windows 下 office 辦公軟體有點類似,不過其實開源免費的。 ![why openoffice](https://img2020.cnblogs.com/other/1843652/202010/1843652-20201015194333331-983890110.png) ### 啟動專案 執行`FilePreviewApplication`的 main 方法,服務啟動後,訪問[http://localhost:8012/](http://localhost:8012/) 會看到如下介面,代表服務啟動成功。 ![專案啟動成功](https://img2020.cnblogs.com/other/1843652/202010/1843652-20201015194333810-870055266.png) ## 使用 我們首先上傳了 3 個不同的型別的檔案來分別演示一下圖片、PDF、Word 文件的預覽。 ![](https://img2020.cnblogs.com/other/1843652/202010/1843652-20201015194334132-198019619.png) ### 圖片的預覽 **kkFileView 支援 jpg,jpeg,png,gif 等多種格式圖片的預覽,還包括了翻轉,縮放圖片等操作。** 圖片的預覽效果如下。 ![圖片的預覽效果](https://img2020.cnblogs.com/other/1843652/202010/1843652-20201015194334774-1599030357.png) ### Word 文件的預覽 **kkFileView 支援 doc,docx 文件預覽。** 另外,根據 Word 大小以及網速問題, Word 預覽提供了兩種模式: - 每頁 Word 轉為圖片預覽 - 整個 Word 文件轉成 PDF,再預覽 PDF。 兩種模式的適用場景如下 - **圖片預覽** :Word 檔案大(載入 PDF 速度比較慢)的情況。 - **PDF 預覽** :內網訪問(載入 PDF 速度比較快)的情況。 圖片預覽模式預覽效果如下: ![](https://img2020.cnblogs.com/other/1843652/202010/1843652-20201015194335421-385341089.png) PDF 預覽模式預覽效果如下: ![](https://img2020.cnblogs.com/other/1843652/202010/1843652-20201015194336482-1678765288.png) ### PDF 文件的預覽 kkFileView 支援 PDF 文件預覽。類似 Word 文件預覽, PDF 預覽提供了兩種模式: - 每頁 Word 轉為圖片預覽 - 整個 Word 文件轉成 PDF,再預覽 PDF。 由於和 Word 文件的預覽展示效果一致,這裡就不放圖片了。 ## 檔案預覽核心程式碼分析 ### API 層 檔案預覽呼叫的介面是 `/onlinePreview` 。 通過分析 `/onlinePreview` 介面我們發現, 後端接收到預覽請求之後,會從 URL 和請求中篩選出自己需要的資訊比如檔案字尾、檔名。 之後會呼叫`FilePreview`類 的 `filePreviewHandle()` 方法。`filePreviewHandle()` 方法是實現檔案預覽的核心方法。 ```java @RequestMapping(value = "/onlinePreview") public String onlinePreview(String url, Model model, HttpServletRequest req) { FileAttribute fileAttribute = fileUtils.getFileAttribute(url); req.setAttribute("fileKey", req.getParameter("fileKey")); model.addAttribute("pdfDownloadDisable", ConfigConstants.getPdfDownloadDisable()); model.addAttribute("officePreviewType", req.getParameter("officePreviewType")); FilePreview filePreview = previewFactory.get(fileAttribute); logger.info("預覽檔案url:{},previewType:{}", url, fileAttribute.getType()); return filePreview.filePreviewHandle(url, model, fileAttribute); } ``` `FilePreview` 是檔案預覽介面,不同的檔案型別的預覽都實現了 `FilePreview` 介面,並實現了 `filePreviewHandle()` 方法。 ### 檔案預覽介面 ```java public interface FilePreview { String filePreviewHandle(String url, Model model, FileAttribute fileAttribute); } ``` 不同的檔案型別的預覽都實現了 `FilePreview` 介面,如下圖所示。 ![](https://img2020.cnblogs.com/other/1843652/202010/1843652-20201015194337575-1042330644.png) 不同檔案型別的預覽都會實現 `FilePreview` 介面,然後重寫`filePreviewHandle()`方法。比如: `OfficeFilePreviewImpl` 這個主要負責處理 office 檔案的預覽、`PdfFilePreviewImpl` 主要負責處理 pdf 檔案的預覽。 ### 檔案預覽具體實現分析 下面我們以 office 檔案的預覽為入口來分析。 首先要明確的是 excel 型別的預覽是通過將 excel 檔案轉換為 HTML 實現的,其他型別 office 檔案的預覽是通過將檔案轉換為 PDF 或者是 圖片的方式來預覽的。 舉個例子。我們上傳了一份名為 `武漢市文化市場管理辦法.docx` 的 Word 檔案並預覽的話,`jodconverter-web/src/main/file` 路徑下會生成兩個相關檔案,這兩個檔案分別對應了我們提到的 PDF 預覽 和 圖片預覽這兩種方式。 - `武漢市文化市場管理辦法.pdf` - 由 Word 檔案所轉化得到的一系列圖片 ![](https://img2020.cnblogs.com/other/1843652/202010/1843652-20201015194338020-418638221.png) 我們以一個名為 `武漢市文化市場管理辦法.docx` 的檔案來舉例說明一下程式碼中是如何做的。 通過分析程式碼, 我們定位到了 `OfficeFilePreviewImpl` 這個主要負責處理 office 檔案預覽的類。 ```java /** * 處理office檔案 */ @Service public class OfficeFilePreviewImpl implements FilePreview { } ``` 我們來簡單分析一下 `OfficeFilePreviewImpl` 類中實現預覽的核心方法是 `filePreviewHandle` 。 > 說明:這部分程式碼的邏輯不夠清晰,還可以抽方法優化以讓人更容易讀懂,感興趣的小夥伴可以自己動手重構一下,然後去給作者提個 PR。 ```java @Override public String filePreviewHandle(String url, Model model, FileAttribute fileAttribute) { // 1.獲取預覽型別(image/pdf/html),使用者請求中傳了officePreviewType引數就取引數的,沒傳取系統預設(image) String officePreviewType = model.asMap().get("officePreviewType") == null ? ConfigConstants.getOfficePreviewType() : model.asMap().get("officePreviewType").toString(); // 2.獲取 URL 地址 String baseUrl = BaseUrlFilter.getBaseUrl();// http://localhost:8012/ // 3.獲取圖片相關資訊 String suffix=fileAttribute.getSuffix();//檔案字尾如docx String fileName=fileAttribute.getName();//檔名如:武漢市文化市場管理辦法.docx // 4. 判斷是否為 html 格式預覽也就是判斷檔案否為 excel boolean isHtml = suffix.equalsIgnoreCase("xls") || suffix.equalsIgnoreCase("xlsx"); // 5. 將檔案的字尾名更換為 .pdf 或者 .html(excel檔案的情況) String pdfName = fileName.substring(0, fileName.lastIndexOf(".") + 1) + (isHtml ? "html" : "pdf"); // 6. 轉換後的檔案輸出的資料夾如 file-online-preview/jodconverter-web/src/main/file/武漢市文化市場管理辦法.pdf) String outFilePath = FILE_DIR + pdfName; // 7 .判斷之前是否已轉換過,如果轉換過,直接返回,否則執行轉換 // 檔案第一次被預覽的時候會首先對檔案進行快取處理 if (!fileUtils.listConvertedFiles().containsKey(pdfName) || !ConfigConstants.isCacheEnabled()) { String filePath; // 下載檔案 Return