在wps或者office裡面可以將pdf轉word,不過只能免費轉前面5頁,超過5頁就需要會員。今天教大家一個Python辦公小技巧:批量Pdf轉Word ,這樣可以自由想轉多少頁都可以。

思路:這裡主要是利用了Python的pdfmine3k庫去提取pdf文字內容,通過python-docx庫去將內容儲存到word中。

下面先看一下效果:

01 環境準備

在開始編寫程式碼之前,咱們先安裝一些用到的Python庫,安裝目錄如下:

pip install pdfminer

注意

使用 pip install docx 安裝模組 docx 後,發現不能正常使用,

並報錯 moduleNotFoundError:No module named 'exceptions'

正解

pip install python-docx

02 提取PDF內容

1.匯入相應的庫

from pdfminer.pdfparser import PDFParser, PDFDocument

解釋

2.讀取pdf內容

在開始讀取之前,先看一下pdf的內容:

辰哥這裡以自己的原創文章按模組分類後,新建了一個兩頁的pdf檔案。

上面程式碼是讀取pdf檔案,並把每一頁內容放到doc.get_pages裡面。

通過迴圈可以把每一頁的內容提取出來,並把每一頁內容列印輸出

03 儲存到word

上面我們已經成功將pdf的內容提取出來,接著我們將內容儲存到word裡面

在遍歷pdf內容裡面將內容逐步寫入儲存。最後儲存命名為:Python研究者-辰哥.docx

04 小結

為了大家方便學習,辰哥已經把本文的完整原始碼上傳,需要的在公眾後臺回覆:pdf轉換

辰哥在本文中主要講解了利用Python對批量Pdf轉換為Word,不明白的地方可以在下方留言,一起交流。