Python3實現批量讀取資料夾中docx檔案,計算表格數量
阿新 • • 發佈:2018-12-22
最近在做學校的srt,需要資料清洗,清洗後的word裡面有6張表格,為了判斷word裡面是否都有6張表格,寫了段python程式碼來判斷。
能實現批量讀取某個資料夾內的所有docx檔案,然後計算docx裡的表格數量。
import os import docx # 判斷檔案字尾 def endWith(s, *endstring): array = map(s.endswith, endstring) if True in array: return True else: return False #待分析資料夾是D:/Files log_d = 'D:/Files' logFiles = os.listdir(log_d) #在D:/Files內遍歷檔案 for filename in logFiles: #判斷檔案是否是docx格式 if endWith(filename, '.docx'): #建立檔案絕對路徑 filePath = log_d+'/'+filename #根據絕對路徑讀取檔案 doc = docx.Document(filePath) #輸出檔名稱和表格數量 print(filename + " " + str(len(doc.tables)))
輸入結果如下: