1. 程式人生 > >用python計算文件行數[裝載自http://www.centoscn.com/python/2013/0806/1110.html]

用python計算文件行數[裝載自http://www.centoscn.com/python/2013/0806/1110.html]

緩存 scn adl 讀取 col bsp 支持 p s file

一、計算文件的行數

最簡單的辦法是把文件讀入一個大的列表中,然後統計列表的長度.如果文件的路徑是以參數的形式filepath傳遞的,那麽只用一行代碼就可以完成我們的需求了:

count = len(open(filepath,‘rU‘).readlines())

如果是非常大的文件,上面的方法可能很慢,甚至失效.此時,可以使用循環來處理:

count = -1
for count, line in enumerate(open(thefilepath, ‘rU‘)):
pass
count += 1

另外一種處理大文件比較快的方法是統計文件中換行符的個數‘\n ‘(或者包含‘\n‘的字串,如在windows系統中):

count = 0
thefile = open(thefilepath, ‘rb‘)
while True:
buffer = thefile.read(8192*1024)
if not buffer:
break
count += buffer.count(‘\n‘)
thefile.close( )

參數‘rb‘是必須的,否則在windows系統上,上面的代碼會非常慢.

linecache是專門支持讀取大文件,而且支持行式讀取的函數庫。 linecache預先把文件讀入緩存起來,後面如果你訪問該文件的話就不再從硬盤讀取

二、讀取文件某一行的內容(測試過1G大小的文件,效率還可以)

import linecache

count = linecache.getline(filename,linenum)


三、用linecache讀取文件內容(測試過1G大小的文件,效率還可以)

str = linecache.getlines(filename)

str為列表形式,每一行為列表中的一個元素

用python計算文件行數[裝載自http://www.centoscn.com/python/2013/0806/1110.html]