1. 程式人生 > >pdfplumber讀取pdf簡歷,並且寫入Excel中

pdfplumber讀取pdf簡歷,並且寫入Excel中

import pdfplumber #解析pdf檔案,尤其帶有表格的檔案
from openpyxl import Workbook #讀寫Excel的檔案

def parse(pdf):
    targets = [] #儲存結果,
    for page in pdf.pages: 
        words = page.extract_words(x_tolerance=5)
        for word in words:
            targets.append(word['text'])
    return targets
    #print(targets)

# 儲存
def save(targets, out_path, sheet_name='targets'):
    wb = Workbook()
    ws = wb.active
    ws.title = sheet_name
    ws.append(targets)
    print(ws)
    #ws.append(list(targets.values()))
    wb.save(out_path)


# 主函式入口
if __name__ == "__main__":
    print(__doc__)
    path = r'/Users/apple/Documents/ST/python/簡歷.pdf'
    out_path = r'/Users/apple/Documents/ST/python/簡歷.xlsx'
    pdf = pdfplumber.open(path)
    targets = parse(pdf)
    save(targets, out_path)
    print('執行結束!')

這個程式碼抽取簡歷所有內容,放在Excel的第一行

 

認識你是我們的緣分,同學,等等,學習人工智慧,記得關注我。

 

 

微信掃一掃
關注該公眾號

《灣區人工智慧》

回覆《人生苦短,我用Python》便可以獲取下面的超高清電子書和程式碼