最近在做學校的srt,需要資料清洗,清洗後的word裡面有6張表格,為了判斷word裡面是否都有6張表格,寫了段python程式碼來判斷。

 

能實現批量讀取某個資料夾內的所有docx檔案,然後計算docx裡的表格數量

 

import os

import docx


# 判斷檔案字尾
def endWith(s, *endstring):
    array = map(s.endswith, endstring)
    if True in array:
        return True
    else:
        return False

#待分析資料夾是D:/Files
log_d = 'D:/Files'
logFiles = os.listdir(log_d)
#在D:/Files內遍歷檔案
for filename in logFiles:
    #判斷檔案是否是docx格式
    if endWith(filename, '.docx'):
        #建立檔案絕對路徑
        filePath = log_d+'/'+filename
        #根據絕對路徑讀取檔案
        doc = docx.Document(filePath)
        #輸出檔名稱和表格數量
        print(filename + " " + str(len(doc.tables)))


輸入結果如下: