pandas讀取大檔案時memoryerror的解決辦法

阿新 • • 發佈：2018-11-10

再用pd.read_csv讀取大檔案時，如果檔案太大，會出現memoryerror的問題。

解決辦法一：pd.read_csv的引數中有一個chunksize引數，為其賦值後，返回一個可迭代物件TextFileReader，對其遍歷即可

reader = pd.read_csv(file_path, chunksize=20)　　# 每次讀取20條資料

 1 import pandas as pd 
 2 
 3 def knn():
 4     # 讀取資料
 5     file_path = './facebook/train.csv'
 6     
 7     reader = pd.read_csv(file_path, chunksize=20)    # 
 每塊為20條資料(index)
 8 
 9     for chunk in reader:
10         print(chunk)
11         break
12 
13 if __name__ == '__main__':
14     knn()

程式碼執行結果如下：

解決辦法二：pd.read_csv的引數中有一個iterator引數，預設為False，將其改為True，返回一個可迭代物件TextFileReader，使用它的get_chunk(num)方法可獲得前num行的資料

import pandas as pd 

 
def knn():
    '''完成k近鄰演算法'''

    # 讀取資料
    file_path = './facebook/train.csv'

    reader = pd.read_csv(file_path, iterator=True)
    chunk = reader.get_chunk(5)    # 獲取前5行資料
    print(chunk)


if __name__ == '__main__':
    knn()

程式碼執行結果如下：

pandas讀取大檔案時memoryerror的解決辦法

再用pd.read_csv讀取大檔案時，如果檔案太大，會出現memoryerror的問題。解決辦法一：pd.read_csv的引數中有一個chunksize引數，為其賦值後，返回一個可迭代物件TextFileReader，對其遍歷即可 reader = pd.read_csv(file_

MYSQL匯入過大檔案時的解決辦法

mysql在通過匯入sql檔案可能會出現下面二個問題: 1.如果sql檔案過大,會出現"MySQL server has gone away"問題; 2.如果sql檔案資料有中文,會出現亂碼 www.2cto.com 解決問題: 問題1:出現MyS

NFS拷貝大檔案出錯的解決辦法

文章目錄 1、問題背景 2、解決辦法第一次嘗試（失敗）第二次嘗試（失敗）第三次嘗試（成功） 1、問題背景在學習《韋東山嵌入式》第二期視訊的時候，需要把ar

pandas 讀取大檔案

from matplotlib import pyplot import scipy as sp import numpy as np from matplotlib import pylab from pandas import Series,

主機控制jmeter遠端負載機發起壓力時無法讀取引數化csv檔案資料的解決辦法

大併發壓力測試的時候，負載機成為效能瓶頸，需要發起多臺負載機對伺服器進行加壓。在做閘道器支付和籤購單上傳介面大併發時候，選擇遠端機作為負載機，發現遠端機能夠成功施加壓力，但是無法讀取本地引數化csv檔案資料（引數化方式為CSV Data Set config）。即使在遠端

Excel大檔案時讀取記憶體溢位的解決方案，測試50M的Excel通過。

1.大檔案xlsx的檔案解析，本案例僅僅只是讀取Excel檔案的內容為例。具體需求可按自己的需求改。 package com.sundy.parse.util; import java.io.File; import java.io.IOException; import

pandas.read_csv——分塊讀取大檔案

訪問本站觀看效果更佳 read_csv中有個引數chunksize，通過指定一個chunksize分塊大小來讀取檔案，返回的是一個可迭代的物件TextFileReader，IO Tools 舉例如下： In [138]: reader = pd.read_table('

nginx傳輸大檔案時，504gateway 問題解決

在傳輸大檔案時，需要增加其響應超時時間，因為後臺服務還在進行資料處理，如果到了65s，nginx會把連線斷開，丟擲一個504超時異常顯示在前臺頁面。這個時候我們需要改變其響應超時時間達到我們需要的效果。檔案配置如下: nginx.conf http { #連線存活超時時間，預設為

GetPrivateProfileString 讀取當前目錄的 ini 配置檔案失敗的解決辦法

函式介紹 GetPrivateProfileString 有兩種，我選用的是 GetPrivateProfileStringA 函式讀取配置檔案，以下是用這個函數出現讀取失敗的解決方案解決辦法讀當前目錄必須寫成 "./Param.ini"，只有 1個小

Win8安裝驅動時提示“雜湊值不在指定的目錄檔案中”的解決辦法

1、Windows鍵+C，或滑鼠螢幕右下角 2、設定→更多電腦設定 3、左邊選常規，右下角重新啟動上面3個步驟也可用這個方法替代：Windows鍵+R→shutdown.exe /r /o /f /t 00→確定 4、等幾秒鐘會出現三個選項，選擇疑難解答 5、高階

pandas 讀取csv檔案讀取指定行讀取csv大檔案分塊讀取方法

當用pandas的read_csv函式或者是read_table函式讀取檔案時，如果遇到大的檔案，需要分塊讀取，在這個基礎上可以讀取指定行，比如讀取標籤全為0的行。程式碼如下： f

關於Android的.so檔案---多個第三方庫載入到工程讀取不到.so的解決辦法

原文連結早期的Android系統幾乎只支援ARMv5的CPU架構，你知道現在它支援多少種嗎？7種！ Android系統目前支援以下七種不同的CPU架構：ARMv5，ARMv7 (從2010年起)，x86 (從2011年起)，MIPS (從2012年起)，ARMv8，MIPS64和x86_64 (從

讀取Excel檔案時出現null的解決方法

在讀取Excel檔案時常常出現讀取某些欄位為null的情況，其實是有值，原因是讀取檔案時，Excel會以第一行的資料型別為參考，如果後邊的與其不一致，則會出現些問題。以下一個朋友的解決方案，他的Excel檔案的連線串寫作如下。據說可以強制資料為字串，具體我已測試過。僅供參考

標頭檔案被多次呼叫時的解決辦法

微控制器程式設計中有時會出現標頭檔案多次呼叫，編譯時導致結構體函式被重複定義的錯誤以STM3210X為例當頭檔案stm32f10x.h被多次呼叫時，會出現函式體被多次定義的錯誤，此時在標頭檔案中新增#ifndef __STM32F10X_H#define __STM32F10

Dom4J讀取XML檔案時出現的connection timed out:connect Nested exception異常解決方法

最近在專案中實現一個雙資料庫的動態讀取樹形選單功能，通過了Dom4J來實現，執行過程中出現以下問題：在本論壇查到原因為 dom4j會去拿DTD增加那些DOCTYPE的預設屬性，因此加入下面一段話即可。解決辦法連結http://topic.csdn.ne

java讀取預設編碼是ansi的文字檔案時，解決中文亂碼問題

// 封裝文字檔案 File file = new File("d:/test11.txt"); // BufferedReader br = new BufferedReader(new FileR

pandas.read_csv分塊讀取大檔案

import time import pandas as pd from tqdm import tqdm # @execution_time def reader_pandas(file, chunkSize=100000, patitions=10 ** 4):

使用selenium時出現 " FileNotFoundError: [WinError 2] 系統找不到指定的檔案。" 的解決辦法。

在使用python的selenium模組模擬瀏覽器登入，使用的下面的程式碼 #author: aspiring from selenium import webdriver # 例項化一個瀏覽器 driver = webdriver.Chrome() # 傳送請求 dr

.NET上傳大檔案時提示Maximum request length exceeded錯誤的解決方法

使用IIS託管應用程式時，當我們需要上傳大檔案（4MB以上）時，應用程式會提示Maximum request length exceeded的錯誤資訊。該錯誤資訊的翻譯：超過最大請求長度。解決方法：使用IIS來託管應用程式，預設的上傳檔案大小為4MB。我們需要增加請求

java在讀取文字檔案時出現中文字元亂碼的解決方法

1.首先將要讀取的文字檔案的編碼格式設定為UTF-82.使用InputStreamReader類取讀取檔案，因為它的構造方法中可以指定字符集，將它的字符集指定為UFT-8的格式。例：BufferedReader buff = new BufferedReader(new In

pandas讀取大檔案時memoryerror的解決辦法

相關推薦