1. 程式人生 > >python學習過程之IO編程

python學習過程之IO編程

python 入門 編程 io

IO編程

IO在計算機中指Input/Output,也就是輸入和輸出。由於程序和運行時數據是在內存中駐留,由CPU這個超快的計算核心來執行,涉及到數據交換的地方,通常是磁盤、網絡等,就需要IO接口。

由於CPU和內存的速度遠遠高於外設的速度,所以,在IO編程中,就存在速度嚴重不匹配的問題。兩種處理方法同步IO和異步IO。

很明顯,使用異步IO來編寫程序性能會遠遠高於同步IO,但是異步IO的缺點是編程模型復雜,反正異步IO的復雜度遠遠高於同步IO。

操作IO的能力都是由操作系統提供的,每一種編程語言都會把操作系統提供的低級C接口封裝起來方便使用,Python也不例外。

讀寫文件是最常見的IO操作。Python內置了讀寫文件的函數,用法和C是兼容的。

基本使用

open("路徑",“r”)如果打開不成功,會拋出錯誤,如果打開成功,可以進一步使用read(),最後使用close()

可以使用try....finally....以防止出錯後關閉不了

也可以 最簡單 with open("路徑",“r”) as f

file-like Object

像open()數返回的這種有個read()方法的對象,在Python中統稱為file-like Object。除了file外,還可以是內存的字節流,網絡流,自定義流等等。file-like Object不要求從特定類繼承,只要寫個read()方法就行。stringIO就是在內存中創建的file-like Object,常用作臨時緩沖。

前面講的默認都是讀取文本文件,並且是UTF-8編碼的文本文件。要讀取二進制文件,比如圖片、視頻等等,"rb"模式打開文件即可

要讀取非UTF-8編碼的文本文件,需要給open()函數傳入encoding參數

遇到有些編碼不規範的文件,你可能會遇到編碼錯誤因為在文本文件中可能夾雜了一些非法編碼的字符。遇到這種情況,open()函數還接收一個errors參數,表示如果遇到編碼錯誤後如何處理。最簡單的方式是直接忽略

寫文件和讀文件是一樣的 r 換成w

StringIO

很多時候,數據讀寫不一定是文件,也可以在內存中讀寫。

StringIO顧名思義就是在內存中讀寫str。

要把str寫入StringIO,我們需要先創建一個StringIO.getvalue()方法用於獲得寫入後的str

BytesIO

StringIO操作的只能是str,如果要操作二進制數據,就需要使用BytesIO。

BytesIO實現了在內存中讀寫bytes,我們創建一個BytesIO,然後寫入一些bytes

操作文件和目錄

操作文件和目錄的函數一部分放在os模塊中,一部分放在os.path模塊中,這一點要註意一下。查看、創建和刪除目錄可以這麽調用:

# 查看當前目錄的絕對路徑:

>>> os.path.abspath(‘.‘)

‘/Users/michael‘

# 在某個目錄下創建一個新目錄,

# 首先把新目錄的完整路徑表示出來:

>>> os.path.join(‘/Users/michael‘, ‘testdir‘)

‘/Users/michael/testdir‘

# 然後創建一個目錄:

>>> os.mkdir(‘/Users/michael/testdir‘)

# 刪掉一個目錄:

>>> os.rmdir(‘/Users/michael/testdir‘)

把兩個路徑合成一個時,不要直接拼字符串,而要通過os.path.join()函數,這樣可以正確處理不同操作系統的路徑分隔符。在linux/Unix/Mac下,os.path.join()返回這樣的字符串:

part-1/part-2

Windows下會返回這樣的字符串:

part-1\part-2

同樣的道理,要拆分路徑時,也不要直接去拆字符串,而要通過os.path.split()函數,這樣可以把一個路徑拆分為兩部分,後一部分總是最後級別的目錄或文件名:

>>> os.path.split(‘/Users/michael/testdir/file.txt‘)

(‘/Users/michael/testdir‘, ‘file.txt‘)

os.path.splitext()可以直接讓你得到文件擴展名,很多時候非常方便:

>>> os.path.splitext(‘/path/to/file.txt‘)

(‘/path/to/file‘, ‘.txt‘)

這些合並、拆分路徑的函數並不要求目錄和文件要真實存在,它們只對字符串進行操作。

文件操作使用下面的函數。假定當前目錄下有一個test.txt文件:

# 對文件重命名:

>>> os.rename(‘test.txt‘, ‘test.py‘)

# 刪掉文件:

>>> os.remove(‘test.py‘)

但是復制文件的函數居然在os模塊中不存在!原因是復制文件並非由操作系統提供的系統調用。理論上講,我們通過上一節的讀寫文件可以完成文件復制,只不過要多寫很多代碼。

幸運的是shutil模塊提供了copyfile()的函數,你還可以在shutil模塊中找到很多實用函數,它們可以看做是os模塊的補充。

最後看看如何利用Python的特性來過濾文件。比如我們要列出當前目錄下的所有目錄,只需要一行代碼:

>>> [x for x in os.listdir(‘.‘) if os.path.isdir(x)]

[‘.lein‘, ‘.local‘, ‘.m2‘, ‘.npm‘, ‘.ssh‘, ‘.Trash‘, ‘.vim‘, ‘Adlm‘, ‘Applications‘, ‘Desktop‘, ...]

要列出所有的.py文件,也只需一行代碼:

>>> [x for x in os.listdir(‘.‘) if os.path.isfile(x) and os.path.splitext(x)[1]==‘.py‘]

[‘apis.py‘, ‘config.py‘, ‘models.py‘, ‘pymonitor.py‘, ‘test_db.py‘, ‘urls.py‘, ‘wsgiapp.py‘]




序列化略過
學習python3廖雪峰過程整理

本文出自 “大李子” 博客,請務必保留此出處http://n1lixing.blog.51cto.com/11772222/1953892

python學習過程之IO編程