python快速讀取非常大的檔案

阿新 • • 發佈：2019-02-10

讀取大檔案是我們平時經常會遇到的問題，我這裡給出兩個比較好的解決方案。第一種

with open("test.txt") as f:
    for line in f:
        #do something with data

這種做法非常的簡單。這個程式碼在開啟檔案的過程中，不會一次性讀取全部檔案，而是採用每次讀取一行的方式，類似於buffer機制。

當然我們也可以自己去實現一個buffer，然後通過協程的方式操作

def readInChunks(fileObj, chunkSize=4096):
    """
    Lazy function to read a file piece by piece.
    Default chunk size: 4kB.
    """ 

    while 1:
        data = fileObj.read(chunkSize)
        if not data:
            break
        yield data

f = open('bigFile')
for chuck in readInChunks(f):
    #do_something(chunk)
f.close()

這段程式碼中我們通過每次讀取4k大小的資料，將所有檔案讀取完。

我對於一個3GB大小的資料進行了讀取測試，分別用時如下：

28.54150631145376 s
28.522545760074877 s

兩者所用時間差不多。

python快速讀取非常大的檔案

讀取大檔案是我們平時經常會遇到的問題，我這裡給出兩個比較好的解決方案。第一種 with open("test.txt") as f: for line in f: #do som

python快速生成一個大檔案

python快速生成一個大檔案主要使用了seek——檔案偏移，先偏移一個很大的空間，然後在寫一些資料即可。主要使用了seek——檔案偏移，先偏移一個很大的空間，然後在寫一些資料即可。 import time def creatfilesize(

python快速讀取大資料1

1 rd = pd.read_csv(path7 + u'0501-0914.csv',encoding = 'gbk',iterator = True) 2 loop =True 3 dflst = [] 4 i = 0 5 while loop: 6 try: 7

python讀取txt大檔案

直接上程式碼： import easygui import os s4 = [] s6 = [] path = easygui.fileopenbox() if path: b = os.path.splitext(path) c = [b[0], '_trace',

pandas 讀取csv檔案讀取指定行讀取csv大檔案分塊讀取方法

當用pandas的read_csv函式或者是read_table函式讀取檔案時，如果遇到大的檔案，需要分塊讀取，在這個基礎上可以讀取指定行，比如讀取標籤全為0的行。程式碼如下： f

windows環境下python CGI上傳大檔案錯誤的解決方法

在測試檔案傳輸時，自編寫指令碼在windows環境下遇到無法正確儲存檔案的問題，經過排查研究後，發現是由於python標準輸入流是以文字的方式開啟的，對換行符作了處理，需要將其設定成二進位制方可解決，新增程式碼如下即可： import cgi, os import c

Python基於django提供大檔案下載介面及Python基於tornado下載大檔案

Django下載大檔案介面程式碼我是基於django的rest介面外掛提供的下載檔案介面，除了需要安裝django之外還需要安裝djangorestframework庫不多說，下面直接貼程式碼 #views.py from rest_fr

linux 快速刪除大量/大檔案

1、快速刪除大量檔案：假如你要在linux下刪除大量檔案，比如100萬、1000萬，像/var/spool/clientmqueue/的mail郵件，/usr/local/nginx/proxy_temp的nginx快取等，那麼rm -rf *可能就不好使了。 rsync

VTK-Python 9 讀取CT slice檔案，並顯示三維影象

#!/usr/bin/env python import vtk aRenderer = vtk.vtkRenderer(); renWin = vtk.vtkRenderWindow(); renWin.AddRenderer(aRenderer); iren = v

java快速讀取文字檔案最後一行資料內容，文字檔案非常大

http://www.iteye.com/problems/42748 public static void main(String[] args) throws Exception { File file = new File("E:/a.txt"); // 100M

python讀取大檔案的方法 python計算檔案的行數和讀取某一行內容的實現方法

python計算檔案的行數和讀取某一行內容的實現方法：最簡單的辦法是把檔案讀入一個大的列表中,然後統計列表的長度.如果檔案的路徑是以引數的形式filepath傳遞的,那麼只用一行程式碼就可以完成我們的需求了: 1、http://blog.csdn.net/shudaq

Python如何快速讀取資料檔案若干行

用Python進行資料分析的童鞋們，經常遇到的問題就是遇到一個數據檔案，大概幾百兆，而只需要其中若干行資料。那麼我們怎麼辦？最笨的辦法，就是一次性將所有的檔案資料載入到記憶體中再做索引或切片處理，可能一次性載入就需要耗費一點時間。如果重複性地做這種事情，你都會覺得不好意思跟自己交代。這裡，我給

python讀取大檔案和普通檔案

讀取檔案，最常見的方式是： with open('filename', 'r', encoding = 'utf-8') as f: for line in f.readlines(): do_something(line) 但是，當完成這一操作時，readlines()

Python 讀取大檔案的方式

對於讀取容量小的檔案，可以使用下面的方法： with open("path", "r") as f: f.read() 但是如果檔案容量很大，高達幾個G或者十幾個G，使用上面這種方式就容易造成記憶體溢位的問題，所以如果進行大容量的檔案讀取建議使用下面這種方式： with open

Python 讀取大檔案

最近在學習python的過程中接觸到了python對檔案的讀取。python讀取檔案一般情況是利用open()函式以及read()函式來完成：f = open(filename,'r') f.read()這種方法讀取小檔案，即讀取遠遠大小小於記憶體的檔案顯然沒有什麼問題。但是

用Python讀取大檔案（下）

上篇講到如何寫一個python程式去處理大檔案的內容讀取。中間涉及了幾個很關鍵的概念，可迭代物件，生成器和檔案物件。本篇解釋下這幾個概念。可迭代物件：在python中一個列表，就是一個可迭代物件，同時它也是迭代器。我們可以用for i in mylist

QT快速讀取資料量很大的Excel檔案

最近寫的一個專案中，有需要讀取資料量很大（有10個sheet，每個sheet有65535行11列的資料）的Excel檔案，用了COM和QODBC兩種方法讀取，速度很慢。你可能會問，為啥不把資料放在資料庫裡，那樣讀取的速度更快？當然，需求要求是可以從資料庫或者從E

python跳過第一行快速讀取檔案內容

Python程式設計時，經常需要跳過第一行讀取檔案內容。簡單的做法是為每行設定一個line_num，然後判斷line_num是否為1，如果不等於1，則進行讀取操作。相應的Python程式碼如下： i

【tkinter】python工具pyinstaller打包生成exe檔案非常大的原因分析（openpyxl）openpyxl

【python】python的打包工具pyinstaller生成exe非常大的原因分析（openpyxl）openpyxl -F 打包出來一個一個都有200多mfrom tkinter import * from tkinter.font import Font from

使用python讀取大檔案

python中讀取資料的時候有幾種方法，無非是read，readline，readlings和xreadlines幾種方法，在幾種方法中，read和xreadlines可以作為迭代器使用，從而在讀取大

python快速讀取非常大的檔案

相關推薦