pdfplumber讀取pdf簡歷,並且寫入Excel中
阿新 • • 發佈:2018-12-31
import pdfplumber #解析pdf檔案,尤其帶有表格的檔案 from openpyxl import Workbook #讀寫Excel的檔案 def parse(pdf): targets = [] #儲存結果, for page in pdf.pages: words = page.extract_words(x_tolerance=5) for word in words: targets.append(word['text']) return targets #print(targets) # 儲存 def save(targets, out_path, sheet_name='targets'): wb = Workbook() ws = wb.active ws.title = sheet_name ws.append(targets) print(ws) #ws.append(list(targets.values())) wb.save(out_path) # 主函式入口 if __name__ == "__main__": print(__doc__) path = r'/Users/apple/Documents/ST/python/簡歷.pdf' out_path = r'/Users/apple/Documents/ST/python/簡歷.xlsx' pdf = pdfplumber.open(path) targets = parse(pdf) save(targets, out_path) print('執行結束!')
這個程式碼抽取簡歷所有內容,放在Excel的第一行
認識你是我們的緣分,同學,等等,學習人工智慧,記得關注我。
微信掃一掃
關注該公眾號
《灣區人工智慧》
回覆《人生苦短,我用Python》便可以獲取下面的超高清電子書和程式碼