1. 程式人生 > >大蛇04 字符編碼和文件操作

大蛇04 字符編碼和文件操作

格式 comm tell 三種 腳本 python 解碼 二進制位 什麽是

字符編碼

重點

‘‘‘
1. 什麽是字符編碼:將人識別的字符轉換計算機能識別的01,轉換的規則就是字符編碼表
2. 常用的編碼表:ascii、unicode、GBK、Shift_JIS、Euc-kr
3. 編碼操作:編碼encode()、解碼decode()
‘‘‘

知識儲備

# 電腦三大核心:cpu - 內存 - 硬盤(數據的存取過程)
# 軟件及python解釋器讀取文件過程:啟動 - 讀取 - 展示|解釋執行
# python2環境的文件頭:# coding: 編碼格式

簡介與發展

‘‘‘
1. ascii - 各國編碼 - 萬國編碼
2. 存取不一致的亂碼現象
3. unicode與utf-8
‘‘‘

核心

# 編碼操作:編碼encode()、解碼decode()

字符與字節

重點

‘‘‘
1. 字節的存儲方式:8個二進制位
2. 字符所占字節數:根據編碼的不同,所占字節數可能不同
3. 三種格式字符串:u‘‘、b‘‘、r‘‘
‘‘‘

了解

‘‘‘
u、b格式字符串轉換: str(b‘‘, encode=‘utf-8‘)、bytes(u‘‘, encode=‘utf-8‘)
‘‘‘

文件操作

重點

‘‘‘
1. 文件操作的三步驟:打開文件 - 使用文件 - 關閉文件
2. 文件操作三要素:文件源、操作模式、編碼
3. with語法:with open(...) as 別名, ..., open(...) as 別名: pass
4. 重點方法:read() | write() | readline() | close() | f.flush() | f.seek()
‘‘‘

操作模式

‘‘‘
主模式:r | w | a
從模式:b | t | +
了解:x | U
‘‘‘

操作方法

讀:read() | readline() | readlines()
寫:write() | writelines() | flush()
光標:seek() | tell()
特征:encoding | closed

了解:readable() | writable() | name 

案例

1. 文件復制
2. 文件修改

了解:py文件腳本機制

大蛇04 字符編碼和文件操作