1. 程式人生 > >python 讀寫、建立 檔案

python 讀寫、建立 檔案

python中對檔案、資料夾(檔案操作函式)的操作需要涉及到os模組和shutil模組。

得到當前工作目錄,即當前Python指令碼工作的目錄路徑: os.getcwd()

返回指定目錄下的所有檔案和目錄名:os.listdir()

函式用來刪除一個檔案:os.remove()

刪除多個目錄:os.removedirs(r“c:\python”)

檢驗給出的路徑是否是一個檔案:os.path.isfile()

檢驗給出的路徑是否是一個目錄:os.path.isdir()

判斷是否是絕對路徑:os.path.isabs()

檢驗給出的路徑是否真地存:os.path.exists()

返回一個路徑的目錄名和檔名:os.path.split()  

   eg os.path.split(‘/home/swaroop/byte/code/poem.txt’) 結果:(‘/home/swaroop/byte/code’, ‘poem.txt’) 

分離副檔名:os.path.splitext()

獲取路徑名:os.path.dirname()

獲取檔名:os.path.basename()

執行shell命令: os.system()

讀取和設定環境變數:os.getenv() 與os.putenv()

給出當前平臺使用的行終止符:os.linesep    Windows使用’\r\n’,Linux使用’\n’而Mac使用’\r’

指示你正在使用的平臺:os.name 

      對於Windows,它是’nt’,而對於Linux/Unix使用者,它是’posix’

重新命名:os.rename(old, new)

建立多級目錄:os.makedirs(r“c:\python\test”)

建立單個目錄:os.mkdir(“test”)

獲取檔案屬性:os.stat(file)

修改檔案許可權與時間戳:os.chmod(file)

終止當前程序:os.exit()

獲取檔案大小:os.path.getsize(filename)


檔案操作:
os.mknod(“test.txt”)        建立空檔案
fp = open(“test.txt”,w)     直接開啟一個檔案,如果檔案不存在則建立檔案

關於open 模式:

w     以寫方式開啟,
a     以追加模式開啟 (從 EOF 開始, 必要時建立新檔案)
r+     以讀寫模式開啟
w+     以讀寫模式開啟 (參見 w )
a+     以讀寫模式開啟 (參見 a )
rb     以二進位制讀模式開啟
wb     以二進位制寫模式開啟 (參見 w )
ab     以二進位制追加模式開啟 (參見 a )
rb+    以二進位制讀寫模式開啟 (參見 r+ )
wb+    以二進位制讀寫模式開啟 (參見 w+ )
ab+    以二進位制讀寫模式開啟 (參見 a+ )

fp.read([size])                     #size為讀取的長度,以byte為單位

fp.readline([size])                 #讀一行,如果定義了size,有可能返回的只是一行的一部分

fp.readlines([size])                #把檔案每一行作為一個list的一個成員,並返回這個list。其實它的內部是通過迴圈呼叫readline()來實現的。如果提供size引數,size是表示讀取內容的總長,也就是說可能只讀到檔案的一部分。

fp.write(str)                     #把str寫到檔案中,write()並不會在str後加上一個換行符

fp.writelines(seq)            #把seq的內容全部寫到檔案中(多行一次性寫入)。這個函式也只是忠實地寫入,不會在每行後面加上任何東西。

fp.close()                        #關閉檔案。python會在一個檔案不用後自動關閉檔案,不過這一功能沒有保證,最好還是養成自己關閉的習慣。  如果一個檔案在關閉後還對其進行操作會產生ValueError

fp.flush()                                      #把緩衝區的內容寫入硬碟

fp.fileno()                                      #返回一個長整型的”檔案標籤“

fp.isatty()                                      #檔案是否是一個終端裝置檔案(unix系統中的)

fp.tell()                                         #返回檔案操作標記的當前位置,以檔案的開頭為原點

fp.next()                                       #返回下一行,並將檔案操作標記位移到下一行。把一個file用於for … in file這樣的語句時,就是呼叫next()函式來實現遍歷的。

fp.seek(offset[,whence])              #將檔案打操作標記移到offset的位置。這個offset一般是相對於檔案的開頭來計算的,一般為正數。但如果提供了whence引數就不一定了,whence可以為0表示從頭開始計算,1表示以當前位置為原點計算。2表示以檔案末尾為原點進行計算。需要注意,如果檔案以a或a+的模式開啟,每次進行寫操作時,檔案操作標記會自動返回到檔案末尾。

fp.truncate([size])                       #把檔案裁成規定的大小,預設的是裁到當前檔案操作標記的位置。如果size比檔案的大小還要大,依據系統的不同可能是不改變檔案,也可能是用0把檔案補到相應的大小,也可能是以一些隨機的內容加上去。

目錄操作:
os.mkdir(“file”)                   建立目錄
複製檔案:
shutil.copyfile(“oldfile”,”newfile”)       oldfile和newfile都只能是檔案
shutil.copy(“oldfile”,”newfile”)            oldfile只能是資料夾,newfile可以是檔案,也可以是目標目錄
複製資料夾:
shutil.copytree(“olddir”,”newdir”)        olddir和newdir都只能是目錄,且newdir必須不存在
重新命名檔案(目錄)
os.rename(“oldname”,”newname”)       檔案或目錄都是使用這條命令
移動檔案(目錄)
shutil.move(“oldpos”,”newpos”)   
刪除檔案
os.remove(“file”)
刪除目錄
os.rmdir(“dir”)只能刪除空目錄
shutil.rmtree(“dir”)    空目錄、有內容的目錄都可以刪
轉換目錄
os.chdir(“path”)   換路徑

Python讀寫檔案
1.open
使用open開啟檔案後一定要記得呼叫檔案物件的close()方法。比如可以用try/finally語句來確保最後能關閉檔案。

file_object = open(‘thefile.txt’)
try:
     all_the_text = file_object.read( )
finally:
     file_object.close( )

注:不能把open語句放在try塊裡,因為當開啟檔案出現異常時,檔案物件file_object無法執行close()方法。

2.讀檔案
讀文字檔案
input = open(‘data’, ‘r’)
#第二個引數預設為r
input = open(‘data’)

讀二進位制檔案
input = open(‘data’, ‘rb’)
 

讀取所有內容
file_object = open(‘thefile.txt’)
try:
     all_the_text = file_object.read( )
finally:
     file_object.close( )
 

讀固定位元組
file_object = open(‘abinfile’, ‘rb’)
try:
    while True:
         chunk = file_object.read(100)
        if not chunk:
            break
         do_something_with(chunk)
finally:
     file_object.close( )
 

讀每行
list_of_all_the_lines = file_object.readlines( )

如果檔案是文字檔案,還可以直接遍歷檔案物件獲取每行:

for line in file_object:
     process line
 

3.寫檔案
寫文字檔案
output = open(‘data’, ‘w’)
 

寫二進位制檔案
output = open(‘data’, ‘wb’)
 

追加寫檔案
output = open(‘data’, ‘w+’)
 

寫資料
file_object = open(‘thefile.txt’, ‘w’)
file_object.write(all_the_text)
file_object.close( )
 

寫入多行
file_object.writelines(list_of_text_strings)

注意,呼叫writelines寫入多行在效能上會比使用write一次性寫入要高。

在處理日誌檔案的時候,常常會遇到這樣的情況:日誌檔案巨大,不可能一次性把整個檔案讀入到記憶體中進行處理,例如需要在一臺實體記憶體為 2GB 的機器上處理一個 2GB 的日誌檔案,我們可能希望每次只處理其中 200MB 的內容。
在 Python 中,內建的 File 物件直接提供了一個 readlines(sizehint) 函式來完成這樣的事情。以下面的程式碼為例:

file = open(‘test.log’, ‘r’)sizehint = 209715200   # 200Mposition = 0lines = file.readlines(sizehint)while not file.tell() - position < 0:       position = file.tell()       lines = file.readlines(sizehint)

每次呼叫 readlines(sizehint) 函式,會返回大約 200MB 的資料,而且所返回的必然都是完整的行資料,大多數情況下,返回的資料的位元組數會稍微比 sizehint 指定的值大一點(除最後一次呼叫 readlines(sizehint) 函式的時候)。通常情況下,Python 會自動將使用者指定的 sizehint 的值調整成內部快取大小的整數倍。

file在python是一個特殊的型別,它用於在python程式中對外部的檔案進行操作。在python中一切都是物件,file也不例外,file有file的方法和屬性。下面先來看如何建立一個file物件:


file(name[, mode[, buffering]]) 
file()函式用於建立一個file物件,它有一個別名叫open(),可能更形象一些,它們是內建函式。來看看它的引數。它引數都是以字串的形式傳遞的。name是檔案的名字。
mode是開啟的模式,可選的值為r w a U,分別代表讀(預設) 寫 新增支援各種換行符的模式。用w或a模式開啟檔案的話,如果檔案不存在,那麼就自動建立。此外,用w模式開啟一個已經存在的檔案時,原有檔案的內容會被清空,因為一開始檔案的操作的標記是在檔案的開頭的,這時候進行寫操作,無疑會把原有的內容給抹掉。由於歷史的原因,換行符在不同的系統中有不同模式,比如在 unix中是一個\n,而在windows中是‘\r\n’,用U模式開啟檔案,就是支援所有的換行模式,也就說‘\r’ ‘\n’ ‘\r\n’都可表示換行,會有一個tuple用來存貯這個檔案中用到過的換行符。不過,雖說換行有多種模式,讀到python中統一用\n代替。在模式字元的後面,還可以加上+ b t這兩種標識,分別表示可以對檔案同時進行讀寫操作和用二進位制模式、文字模式(預設)開啟檔案。
buffering如果為0表示不進行緩衝;如果為1表示進行“行緩衝“;如果是一個大於1的數表示緩衝區的大小,應該是以位元組為單位的。

file物件有自己的屬性和方法。先來看看file的屬性。


closed #標記檔案是否已經關閉,由close()改寫 
encoding #檔案編碼 
mode #開啟模式 
name #檔名 
newlines #檔案中用到的換行模式,是一個tuple 
softspace #boolean型,一般為0,據說用於print

file的讀寫方法:


F.read([size]) #size為讀取的長度,以byte為單位 
F.readline([size]) 
#讀一行,如果定義了size,有可能返回的只是一行的一部分 
F.readlines([size]) 
#把檔案每一行作為一個list的一個成員,並返回這個list。其實它的內部是通過迴圈呼叫readline()來實現的。如果提供size引數,size是表示讀取內容的總長,也就是說可能只讀到檔案的一部分。 
F.write(str) 
#把str寫到檔案中,write()並不會在str後加上一個換行符 
F.writelines(seq) 
#把seq的內容全部寫到檔案中。這個函式也只是忠實地寫入,不會在每行後面加上任何東西。 
file的其他方法:


F.close() 
#關閉檔案。python會在一個檔案不用後自動關閉檔案,不過這一功能沒有保證,最好還是養成自己關閉的習慣。如果一個檔案在關閉後還對其進行操作會產生ValueError 
F.flush() 
#把緩衝區的內容寫入硬碟 
F.fileno() 
#返回一個長整型的”檔案標籤“ 
F.isatty() 
#檔案是否是一個終端裝置檔案(unix系統中的) 
F.tell() 
#返回檔案操作標記的當前位置,以檔案的開頭為原點 
F.next() 
#返回下一行,並將檔案操作標記位移到下一行。把一個file用於for … in file這樣的語句時,就是呼叫next()函式來實現遍歷的。 
F.seek(offset[,whence]) 
#將檔案打操作標記移到offset的位置。這個offset一般是相對於檔案的開頭來計算的,一般為正數。但如果提供了whence引數就不一定了,whence可以為0表示從頭開始計算,1表示以當前位置為原點計算。2表示以檔案末尾為原點進行計算。需要注意,如果檔案以a或a+的模式開啟,每次進行寫操作時,檔案操作標記會自動返回到檔案末尾。 
F.truncate([size]) 
#把檔案裁成規定的大小,預設的是裁到當前檔案操作標記的位置。如果size比檔案的大小還要大,依據系統的不同可能是不改變檔案,也可能是用0把檔案補到相應的大小,也可能是以一些隨機的內容加上去。

http://www.cnblogs.com/allenblogs/archive/2010/09/13/1824842.html

http://www.cnblogs.com/rollenholt/archive/2012/04/23/2466179.html

相關推薦

python 建立 檔案

python中對檔案、資料夾(檔案操作函式)的操作需要涉及到os模組和shutil模組。 得到當前工作目錄,即當前Python指令碼工作的目錄路徑: os.getcwd() 返回指定目錄下的所有檔案和目錄名:os.listdir() 函式用來刪除一個檔案:os.remove() 刪除多個目錄:os.remov

使用Python/追加excel檔案

一:需要用到的庫 xlrd:讀取excel檔案 xlrd:寫入excel檔案 xlutils:修改/追加excel檔案 直接pip install 庫名即可安裝成功 二:官方文件 如果想詳細瞭解,請一定閱讀官方文件 xlrd:http:/

Pythontxt文字檔案的操作方法全解析

一、檔案寫入(慎重,小心別清空原本的檔案) 步驟:開啟 -- 寫入 -- (儲存)關閉 直接的寫入資料是不行的,因為預設開啟的是'r' 只讀模式 使用r+ 模式不會先清空,但是會替換掉原先的檔案,如下面的例子:hello boy! 被替換成hello aay! path='G:\Python

Pythoncsv格式檔案

讀入: import csv fp = open(r'F:\fish\sample.csv','r') rdcsv = csv.reader(fp,dialect='excel') for row in rdcsv: print row

從零開始學C++之IO流類庫(三):檔案二進位制檔案檔案隨機

#include <cassert>#include <iostream>#include <fstream>#include <string>using namespace std;struct Test {     int a;     int b; };i

Python/追加excel檔案Demo

三個工具包 python操作excel的三個工具包如下,注意,只能操作.xls,不能操作.xlsx。 xlrd: 對excel進行讀相關操作 xlwt: 對excel進行寫相關操作 xlutils: 對excel讀寫操作的整合 這三個工具包都可以直接使

Python檔案批量建立複製內容修改和重新命名

需求:一個郵件檔案對應一個CSV檔案,對大量的郵件檔案重新命名,然後把此檔案移動到對應的CSV檔案目錄下,檢查CSV檔案中郵件名稱內容與格式的正確性,不正確的做出修改,正確的保留。資料夾中最後是一個(視訊、郵件等)檔案對應一個CSV檔案。 1.建立並寫入CSV檔案

Python檔案&IO處理技巧(1): 重定向間隔符路徑存在性與檔案列表

1. 文字資料的讀寫 open() & write() : rt模式的重新整理模式 當我們需要讀寫各種不同編碼的文字資料(如ASCII,UTF-8或UTF-16編碼等), 可以直接使用帶rt模式的open()內建函式。如果需要將文字內容寫入到一個檔案中,就要使用帶有 w

Python檔案&IO處理技巧(1): 重定向間隔符路徑存在性與檔案列表

1. 文字資料的讀寫 open() & write() : rt模式的重新整理模式 當我們需要讀寫各種不同編碼的文字資料(如ASCII,UTF-8或UTF-16編碼等), 可以直接使用帶rt模式的open()內建函式。如果需要將文字內容寫入到一個檔案中,就要使用帶有

python 檔案時,rrtrbr+的區別

文字檔案中的 回車 在不同作業系統中所用的字元表示有所不同。 Windows: \r\n Linux/Unix: \n Mac OS: \r python讀寫檔案 open()中 r rb rt rt模式下

python技巧實用篇】python檔案jieba自定義字典

import jieba from astropy.table.np_utils import join import os import sys import jieba.posseg as p

Python爬蟲】Requests 請求並儲存到excel檔案

爬取前程無憂職位資訊 此次我們用簡單的爬蟲來展示如何把爬到提取出的資訊儲存的excel檔案中.(ps:首先你要安裝好模組openpyxl否則就點選右上角離開,百度搜素安裝.) 選前程無憂的網頁作為案例是因為主編最近在看看工作的訊息,想想就順手寫了一個為方便尋找滿足自己要

python檔案刪除複製的操作總結

1. read三種不同的方式f = open('hello.txt') #'hello.txt'指的是檔案的名稱 while True: text = f.readline() #讀取檔

python 建立目錄,檔案

python中對檔案、資料夾(檔案操作函式)的操作需要涉及到os模組和shutil模組。 得到當前工作目錄,即當前Python指令碼工作的目錄路徑: os.getcwd() 返回指定目錄下的所有檔案和目錄名:os.listdir() 函式用來刪除一個檔案:

Python之IO程式設計——檔案StringIO/BytesIO操作檔案和目錄序列化

What is your name? Eric We'll remember you when you come back, Eric!否則,輸出將如下:Welcome back, Eric!    1.3重構    你經常會遇到這樣的情況:程式碼能夠正確地執行,但可做進一步的改進——將程式碼劃分為一系列完成

python爬蟲】追加到excel檔案

爬取糗事百科熱門 安裝 讀寫excel 依賴 pip install xlwt 安裝 追加excel檔案內容 依賴 pip install xlutils 安裝 lxml import csv import requests fr

C++Python文件定位等操作

末尾 wid 字節 body log 大於 內容 app closed 一、C++文件流 1、文件流對象   C++中的文件流對象(fstream)是繼承自iostream的一個類,其關系如下: fstream可以用IO運算符(>>和<<)

Python 操作Excel —— 安裝第三方庫(xlrdxlwtxlutils)

保存數據 下載 實用 第三方 直接 install pytho 方法 xls 數據處理是 Python 的一大應用場景,而 Excel 則是最流行的數據處理軟件。因此用 Python 進行數據相關的工作時,難免要和 Excel 打交道。 如果僅僅是要以表單形式保存數據,可

自動化day3---Python基礎(list字典元組文件字符串格式化)

int() 文件讀寫 移動 ace div 補齊 解決 讀一行 ext 1.list list的操作 #數組---list arraystus = [‘xiaohei‘,‘xiaobai‘,‘xiaolan‘]#計算機取值是從0開始的#0 1 2 3#下標 角標 索引

php如何利用python實現對pdf文件的操作(合並分割)

PHP實現pdf文件截取 PHP調用python腳本 php如何利用python實現對pdf文件的操作 需求:在PHP裏實現了把8.pdf的前4頁pdf文件截取出來生成新的pdf文件。 詳細步驟如下: 1. 安裝python第三方庫PyPDF2 前提:python必須是3.x版本以上,必要時需要升級p