1. 程式人生 > >python自動化處理txt文字檔案

python自動化處理txt文字檔案

       這學期從開學到現在,關於自動化處理檔案的程式設計需求已經做過一次了,上次是處理excel檔案,用Java語言寫的,因為檔案內容牽涉到學生資訊,就沒有寫部落格公佈原始碼了。這次需求是今天晚飯時師姐提出來的,本來想拒絕的,這幾天天天忙的都沒有時間學Java了,但想想這碼程式碼的事還是男生來吧。這次採用python語言解決的。

需求:將上千份文字檔案讀取出來,提取裡面的資料進行比較大小。

思路:剛開始想用正則表示式提取內容,但真正開始寫的時候發現這不是一個明智的選擇,首先正則表示式需要預先定義規則,但這裡面的變數有點多,而且每個文本里面的變數並不固定,所以預先用正則表示式寫規則太麻煩了。所以換成切割資料的方式處理。中間還想過set和json的方式去處理,但因時間關係和python功力淺薄就放棄了。

建立工程:autoTXT


core資料夾用來存放程式碼

data資料夾用來放資料

input資料夾下用來放待處理檔案

output資料夾用來方式提取出來的變數檔案,變數名定義成檔名,檔案內容存放變數資料

MinMax資料夾下存放比較大小結果檔案

晚飯回來後根據需求很快就把程式碼寫好了,隨後發給師姐後就去怕跑步了,跑完步回來後師姐給我說有個奇怪的bug...........

發現有兩個變數比較出來不一樣,這個bug確實奇怪,比如其中一個變數裡的列表資料裡面全部是‘13’但比較結果出來後竟然是最大值9,最小值10,一臉懵逼。


我沒有細看python自帶min()和max()函式是怎麼比較的字串大小的,索性全部轉成int型後,結果正常了


原始碼已上傳github,由於檔案數量限制,故刪除大量input資料夾下的資料,如果您打開了連結那就麻煩點個星星唄。