1. 程式人生 > >字符串前面加u、r、b的含義

字符串前面加u、r、b的含義

code re模塊 字符串 普通 亂碼 bytes 3.x nic 編碼

u/U:表示unicode字符串
不是僅僅是針對中文, 可以針對任何的字符串,代表是對字符串進行unicode編碼。 
一般英文字符在使用各種編碼下, 基本都可以正常解析, 所以一般不帶u;但是中文, 必須表明所需編碼, 否則一旦編碼轉換就會出現亂碼。 
建議所有編碼方式采用utf8
r/R:非轉義的原始字符串
與普通字符相比,其他相對特殊的字符,其中可能包含轉義字符,即那些,反斜杠加上對應字母,表示對應的特殊含義的,比如最常見的”\n”表示換行,”\t”表示Tab等。而如果是以r開頭,那麽說明後面的字符,都是普通的字符了,即如果是“\n”那麽表示一個反斜杠字符,一個字母n,而不是表示換行了。 
以r開頭的字符,常用於正則表達式,對應著re模塊。
b:bytes
python3.x裏默認的str是(py2.x裏的)unicode, bytes是(py2.x)的str, b”“前綴代表的就是bytes 
python2.x裏, b前綴沒什麽具體意義, 只是為了兼容python3.x的這種寫法

字符串前面加u、r、b的含義