Python讀csv文件去掉一列後再寫入新的文件

阿新 • • 發佈：2017-12-28

width class 左右 head adl 寫文件增加 false 打開文件

用了兩種方式解決該問題，都是網上現有的解決方案。

場景說明：

有一個數據文件，以文本方式保存，現在有三列user_id,plan_id,mobile_id。目標是得到新文件只有mobile_id,plan_id。

解決方案

方案一：用python的打開文件寫文件的方式直接擼一遍數據，for循環內處理數據並寫入到新文件。

代碼如下：

def readwrite1( input_file,output_file):
    f = open(input_file, ‘r‘)
    out = open(output_file,‘w‘)
    print (f)
    for line in 
 f.readlines():
        a = line.split(",")
        x=a[0] + "," + a[1]+"\n"
        out.writelines(x)
    f.close()
    out.close()

方案二：用 pandas 讀數據到 DataFrame 再做數據分割，直接用 DataFrame 的寫入功能寫到新文件

代碼如下：

def readwrite2(input_file,output_file):
    date_1=pd.read_csv(input_file,header=0,sep=‘,‘)
    date_1[[ 
‘mobile‘, ‘plan_id‘]].to_csv(output_file, sep=‘,‘, header=True,index=False)

從代碼上看，pandas邏輯更清晰。

下面看下執行的效率吧！

def getRunTimes( fun ,input_file,output_file):
    begin_time=int(round(time.time() * 1000))
    fun(input_file,output_file)
    end_time=int(round(time.time() * 1000))
    print("讀寫運行時間：",(end_time-begin_time)," 
ms")

getRunTimes(readwrite1,input_file,output_file)  #直接擼數據
getRunTimes(readwrite2,input_file,output_file1) #使用dataframe讀寫數據

讀寫運行時間： 976 ms
讀寫運行時間： 777 ms

input_file 大概有27萬的數據，dataframe的效率比for循環效率還是要快一點的，如果數據量更大些，效果是否更明顯呢？

下面試下增加input_file記錄的數量試試，有如下結果

input_file	readwrite1	readwrite2
27W	976	777
55W	1989	1509
110W	4312	3158

從上面測試結果來看,dataframe的效率提高大約30%左右。

Python讀csv文件去掉一列後再寫入新的文件

width class 左右 head adl 寫文件增加 false 打開文件用了兩種方式解決該問題，都是網上現有的解決方案。場景說明：有一個數據文件，以文本方式保存，現在有三列user_id,plan_id,mobile_id。目標是得到新文件只有mobile_

python讀csv格式文檔並用matplotlib繪制圖表

IT ima ont 技術 pen highlight png src 同時 import csv from matplotlib import pyplot as plt from datetime import datetime fileName = ‘sitk

python#讀csv,excel,json數據

.json pen pandas load word () exc code pre 1 #讀csv,excel,json數據 2 with open(‘E:\\test\\xdd.csv‘,‘r‘) as f: 3 for line in f.readli

Python：列表中按某一列作為索引查詢其他列表中對應資訊，找到後插入當前列表。

直接複製，修改地址後使用。修改三個位置，如備註。 #coding=utf-8 import os.path import numpy as np if __name__=="__main__": list_1_txt= open('list1.txt')#這裡，讀取第一個列表 &

MFC多文件（一）：檢視中獲取文件指標

多文件系列 MFC多文件（一）：檢視中獲取文件指標 MFC多文件（二）：文件中獲取檢視指標 MFC多文件（三）：文件與檢視繫結問題文件與檢視繫結後，在檢視中如何獲取文件指標？新建MFC多文件工程(命名為Test)，自動生成了一個C

Python從Excel中讀取日期一列

import xlrd import datetime file=u"伏特加.xls"#注意讀中文檔名稍微處理一下 data=xlrd.open_workbook(file) table = data.sheet_by_index(0)#按照索引讀Excel檔案 colC

python 解析execl文件並寫入新文件

first info main urn odi 創建 exceptio append cell #!/usr/bin/env python#coding:utf-8import osimport xlrd,xlwtimport requests NatExeclFile=o

2017年自媒體人必備軟件：一款免安裝錄屏軟件！

錄屏軟件優酷錄屏軟件現在自媒體這麽火，你還沒加入的就out啦，如果你是專門發視頻的自媒體人，那麽今天有福了，PCGOGO要推薦一款功能專一，免安裝的錄屏軟件給大家。沒錯，就是：優酷桌面錄屏！為什麽那麽多錄屏軟件不推偏偏要推薦這一款呢？我主要是看上了他免安裝，免安裝

軟件推薦 ---一款優秀的通信組件 HP_Socket

.text 連接 tar .com mar ive enc .get ram * HP-Socket 官方網站：http://www.jessma.org* HP-Socket 項目主頁：http://www.oschina.net/p/hp-socket* HP-Sock

python中pandas.DataFrame對行與列求和及新增新行與列示例

本文介紹的是python中pandas.DataFrame對行與列求和及新增新行與列的相關資料，下面話不多說，來看看詳細的介紹吧。方法如下：匯入模組： ? 1 2 3 from pandas import DataFrame import panda

python 讀寫檔案把爬取的圖片資訊寫入檔案

1.開啟檔案時，file 和io.open的區別 file ：如果檔案不存在直接報錯 open ：如果檔案不存在先建立檔案再進行寫入 2.把字串寫入csv檔案 ab+ 追加內容到csv檔案 ab 追加內容到csv檔案但是第一行會空出來

U盤大盜，Python檢測U盤插入、自動複製檔案並寫入新檔案！

技術要點：學習Python中有不明白推薦加入交流群 &

如何用python讀寫CSV 格式文件

文件原理 color print 讀取 python 數據 pytho bold 工作中經常會碰到讀寫CSV文件的情況。記錄下，方便自己以後查詢並與大家一起分享：寫CSV文件方法一： import csv #導入CSV with open("D:\eg

python讀寫csv文件的實戰

python 自動化測試小強測試品牌接口測試測試幫日記 csv介紹csv是什麽？大家估計都聽過，不過我猜很少能有人比較全面的解釋下的，那麽小弟就獻醜一下。csv我理解的是一個存儲數據的文件，裏面以逗號作為分割進行存儲（當然也可以用制表符進行分割）。csv的規則1 開頭是不留空，以行為

python讀寫csv文件

使用 oca csv 一個讀寫 clas 字符 pre int 1、導入python內置模塊csv import csv 2、讀取csv文件內容 csv_file = csv.reader(open("csvfile.csv","r")) for line in

Python基礎筆記系列十一：標準輸入輸出、文件讀寫和指針等操作

mode strong sublime pre 字符串類型類型 print語句 open 同時　　本系列教程供個人學習筆記使用，如果您要瀏覽可能需要其它編程語言基礎（如C語言），why?因為我寫得爛啊，只有我自己看得懂！！標準輸入輸出一、輸入　　在sublime中這

Python--讀寫CSV文件

Python–讀寫CSV文件 CSV是英文Comma Separate Values（逗號分隔值）的縮寫，顧名思義，文件的內容是由 “,” 分隔的一列列的資料構成的。CSV文件是一種編輯方便，視覺化效果極佳的資料儲存方式。而Python中有著非常強大的庫可以處

在Qt中調用python,讀取csv文件，實現K近鄰算法(一)

修改 ref log nali show ofo ica blog 讀取csv文件目錄： 1.從Qt中調用py腳本裏的一個無參函數，功能：打印"hello python" 　　a)相關配置　　b)踩過的一些坑 2.從Qt中調用py腳本裏的一個有參函數並接收返回值

python 讀寫txt文件並用jieba庫進行中文分詞

mage 亂碼技術分享流行 ictclas 函數結果 class 配置 python用來批量處理一些數據的第一步吧。對於我這樣的的萌新。這是第一步。 #encoding=utf-8 file=‘test.txt‘ fn=open(file,"r") print f

老男孩教育每日一題-第61天-使用命令調換 /etc/passwd 文件裏所有的第一列和最後一列位置

sed awk 每日一題調換位置老男孩教育每日一題-第61天-使用命令調換 /etc/passwd 文件裏 root 位置和/bin/bash 位置？即將所有的第一列和最後一列位置調換？例：默認：root:x:0:0:root:/root:/bin/bash修改後：/bin/bash:x:

Python讀csv文件去掉一列後再寫入新的文件

相關推薦