1. 程式人生 > >Python讀寫檔案的幾種不同方式,特別對出現‘b’的解讀

Python讀寫檔案的幾種不同方式,特別對出現‘b’的解讀

一、Python檔案讀寫的幾種模式:

'r':預設值,表示從檔案讀取資料。
'w':表示要向檔案寫入資料,並截斷以前的內容
'a':表示要向檔案寫入資料,新增到當前內容尾部
'r+':表示對檔案進行可讀寫操作(刪除以前的所有資料)
'r+a':表示對檔案可進行讀寫操作(新增到當前檔案尾部)

'b':表示要讀寫二進位制資料

二、使用'r'進行讀取二進位制檔案時,可能會出現文件讀取不全的現象:

讀檔案 進行讀檔案操作時,直到讀到文件結束符(EOF)才算讀取到檔案最後,Python會認為位元組\x1A(26)轉換成的字元為文件結束符(EOF),

例如:

     二進位制檔案中存在如下從低位向高位排列的資料:7F 32 1A 2F 3D 2C 12 2E 76
     如果使用'r'進行讀取,則讀到第三個位元組,即認為檔案結束。

     如果使用'rb'按照二進位制位進行讀取的,不會將讀取的位元組轉換成字元,從而避免了上面的錯誤。

解決方案:二進位制檔案就用二進位制方法讀取'rb'

總結:使用'r'的時候,如果碰到'0x1A',就視為檔案結束,就是EOF。使用'rb'則不存在這個問題,會一直讀到文章末尾。

三、寫檔案 對於字串x='abc\ndef',我們可用len(x)得到它的長度為7,\n我們稱之為換行符,實際上是0x0A。當我們用'w'即文字方式寫的時候,在windows平臺上會自動將'0x0A'變成兩個字元'0x0D','0x0A',即檔案長度實際上變成8。當用'r'文字方式讀取時,又自動的轉換成原來的換行符。 如果換成'wb'二進位制方式來寫的話,則會保持一個字元不變,讀取的時候也是原樣讀取。 所以如果用文字方式寫入,用二進位制方式讀取的話,就要考慮這多出的一個位元組了。'0x0D'也稱回車符。 Linux下不會變,因為linux只使用'0X0A'來表示換行。

 

Python3的字串的編碼語言用的是unicode編碼,由於Python的字串型別是str,在記憶體中以Unicode表示,一個字元對應若干位元組,如果要在網路上傳輸,或儲存在磁碟上就需要把str變成以位元組為單位的bytes

python對bytes型別的資料用帶b字首的單引號或雙引號表示:b'ABC'