利用python獲取pdf檔案元資料
開發語言:python3
開發工具:pycharm
python第三方模組:PyPDF2
python內建模組:sys
第一步:pycharm安裝第三方模組“PyPDF2”
第二步:匯入模組“PyPDF2”,“sys”
第三步:定義一個變數,將pdf檔案路徑賦值給變數
第四步:呼叫open()用‘rb’二進位制方式讀取檔案(這裡我們可以列印下看看得到了什麼)
讀取的內容傳給PyPDF2.PdfFileReader(),初始化一個PdfFileReader物件
第五步:呼叫PdfFileReader物件的getDocumentInfo()方法
得到pdf檔案元資料(列印來看看得到了什麼)
第六步:遍歷字典的鍵值對(分別列印鍵和值來看下)
第七步:最終實現了我們的目的,得到了pdf的元資料
我們可以完善我們的程式碼讓他看起來像個工具指令碼
相關推薦
利用python獲取pdf檔案元資料
開發語言:python3 開發工具:pycharm python第三方模組:PyPDF2 python內建模組:sys 第一步:pycharm安裝第三方模組“PyPDF2” &n
手把手教你如何用Python從PDF檔案中匯出資料(附連結)
有很多時候你會想用Python從PDF中提取資料,然後將其匯出成其他格式。不幸的是,並沒有多少Python包可以很好的執行這部分工作。在這篇貼子中,我們將探討多個不同的Python包,並學習如何從PDF中提取某些圖片。儘管在Python中沒有一個完整的解決方案,你還是應該能夠運用這裡的技能開始上手。
Python程式設計:pypdf2和pdfplumber獲取pdf檔案的頁數
pypdf2 安裝 pip install pypdf2 程式碼例項 from PyPDF2 import PdfFileReader filename = "test.pdf" reader = PdfFileReader(filename) # 不解密可能會報錯
利用python獲取微信企業號打卡資料,並生成windows計劃任務
由於公司的系統用的是Java版本,開通了企業號打卡之後又沒有預算讓供應商做資料對接,所以只能自己搗鼓這個,以下是個人設定的一些內容,僅供大家參考 安裝python python的安裝,這裡就不詳細寫了,大家可自行度娘或google。 安裝第三方庫 python
利用python獲取nginx服務的ip以及流量統計信息
服務 open contex int bin line define pytho repeat #!/usr/bin/python #coding=utf8 log_file = "/usr/local/nginx/logs/access.log" with open
利用Python自動傳送釘釘資料訊息
作為一個Python程式設計師,老闆每次在釘釘上問我要資料我都是用Python自動回覆的,順便設了個定時沒事問候一下老闆,哈哈 美滋滋~ 用Python實現在釘釘自動發資料,老闆現在問我要資料我都是秒回! 在這裡相信有許多想要學習python的小夥伴,還是要向大家推薦下! 小編我整
自從我學會利用Python來傳檔案!就在也不用某網盤的臉色傳了!
如果你看過我最近的兩篇文章,你一定就會猜到接下來會發生什麼了,但凡碰到什麼棘手的問題,就是我號稱「簡潔優雅,省心省力」的 Python 閃亮登場的時候了,知道這是什麼麼?這就是傳說中的主角光環,所以啊,學習 Python 刻不容緩。 Python 中內建了一個「下載伺服器
C#如何操控FTP,獲取FTP檔案或資料夾列表,獲取FTP檔案大小,FTP上傳,FTP刪除檔案,FTP新建資料夾、刪除資料夾
C#如何操控FTP 出處:http://www.cnblogs.com/rond/archive/2012/07/30/2611295.html,http://www.cnblogs.com/rond 關於FTP的應用免不了要對FTP進行增刪查改什麼的。通過搜尋,整理和修改
python操作txt檔案中資料教程[1]-使用python讀寫txt檔案
python操作txt檔案中資料教程[1]-使用python讀寫txt檔案 覺得有用的話,歡迎一起討論相互學習~Follow Me 原始txt檔案 程式實現後結果 程式實現 filename = './test/test.txt' contents = [] DNA_sequence
python操作txt檔案中資料教程[2]-python提取txt檔案
python操作txt檔案中資料教程[2]-python提取txt檔案中的行列元素 覺得有用的話,歡迎一起討論相互學習~Follow Me 原始txt檔案 程式實現後結果-將txt中元素提取並儲存在csv中 程式實現 import csv filename = "./test/te
python操作txt檔案中資料教程[3]-python讀取資料夾中所有txt檔案並將資料轉為csv檔案
python操作txt檔案中資料教程[3]-python讀取資料夾中所有txt檔案並將資料轉為csv檔案 覺得有用的話,歡迎一起討論相互學習~Follow Me 參考文獻 python操作txt檔案中資料教程[1]-使用python讀寫txt檔案 python操作txt檔案中資料教程[2]-pyth
利用Python實現csv檔案的合併和去重
方法一: 這種方法需要引入glob模組 glob模組是最簡單的模組之一,內容非常少。用它可以查詢符合特定規則的檔案路徑名。跟使用windows下的檔案搜尋差不多。查詢檔案只用到三個匹配符:”*”, “?”, “[]”。”*”匹配0個或多個字元;”?”匹配單個字元;”[]”匹配指定範圍內的
Python----獲取http請求報文資料
Python—-獲取http請求報文資料 import socket if __name__ == '__main__': # 1.建立tcp服務端套接字 tcp_server_socket = socket.socket(socket.AF_
python讀txt檔案讀資料,然後修改資料,再以矩陣形式儲存在檔案中
import os os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2' # -*- coding: UTF-8 -*- import numpy as np import glob import tensorflow as tf flag=T
用python將.h5檔案的資料轉化成.pcd檔案
import h5py import numpy as np import os import math from open3d import * filename = '/home/jp/project/pointnet/sem_seg/indoor3d_sem_seg_
python實戰-pdf檔案轉txt之類的文字可編輯型別檔案
背景:最近剛好需要將一個pdf的內容打出來,這是個比較枯燥的內容,而且pdf裡面的文字明顯是規範的,所以想寫個指令碼讀取內容,直接複製貼上。剛好,python的理念就是不重複造輪子,這樣的包自然是有的,這個指令碼最主要的包就是pdfminer3k。 1.思路 解析出文件,
利用python批量下載ERA的資料
終於開始用python了,只學了兩天的python小白上線下載資料(被逼的)。 其實這個有一些很好的教程,我直接貼上好了。批量下載的教程 其中的一些引數官網的解釋很清楚的,可以先試著下載一個月的資料,再獲取它的request提供參考 最後是我的一些程式碼,以及註釋 這
python中csv檔案中資料新增到MongoDB資料庫
使用csv中的DictReader函式讀取 #!/usr/bin/env python # -*- coding: utf-8 -*- # @Time : 2018/10/21 11:31 # @Author : deli Guo # @Site :
機器學習_利用python從網上自動下載資料
機器學習一個必要的前提條件就是獲得大量資料,尤其對於我們剛開始接觸機器學習的時候,網上提供了大量開源資料來源,方便我們進行學習,但是這些資料來源會隨著時間變換,因此萌生一個自動下載資料的方法,剛好網上也有很多的方法,結合別的部落格主的方法和自己的理解寫了一個利用python自
python 獲取當前檔案的指定型別的檔名
import os def getFiles(): files = os.listdir(os.getcwd()) # os.getcwd() 獲取當前檔案的路徑 print(files) filesList = [] fo