1. 程式人生 > >python 中文 str 以及 unicode區別和互相轉換

python 中文 str 以及 unicode區別和互相轉換

  • 加不加u是有區別的哦
    這裡寫圖片描述

  • unicode到string 只需要encode一下,尤其在我們讀取unicode的文字,然後需要進行字元拼接的時候,本身unicode無法進行拼接
    這裡寫圖片描述

  • string decode之後就是unicode了
    這裡寫圖片描述

  • string和string, 以及 unicode和unicode 可以進行拼接

這裡寫圖片描述

這裡寫圖片描述

  • 但是string和unicode在一起就有問題了

這裡寫圖片描述


In [38]: 

In [38]: 

In [38]: a1 + b1
---------------------------------------------------------------------------
UnicodeDecodeError Traceback (most recent call last) <ipython-input-38-ffd3f356020c> in <module>() ----> 1 a1 + b1 UnicodeDecodeError: 'ascii' codec can't decode byte 0xe5 in position 0: ordinal not in range(128)

我們該怎麼辦呢

In [39]: a1.decode('utf-8') + b1
Out[39
]: u'\u5927\u4e2d' In [40]: In [40]: In [40]: a1 + b1.encode("utf-8") Out[40]: '\xe5\xa4\xa7\xe4\xb8\xad'

這裡寫圖片描述

相關推薦

python 中文 str 以及 unicode區別互相轉換

加不加u是有區別的哦 unicode到string 只需要encode一下,尤其在我們讀取unicode的文字,然後需要進行字元拼接的時候,本身unicode無法進行拼接 string d

js 中文漢字、Unicode、ASCII互相轉換函式程式碼

Unicode介紹 Unicode(統一碼、萬國碼、單一碼)是一種在計算機上使用的字元編碼。 Unicode 是為了解決傳統的字元編碼方案的侷限而產生的,它為每種語言中的每個字元設定了統一併且唯一的二進位制編碼,以滿足跨語言、跨平臺進行文字轉換、處理的要求。 Unicode

python中基本類型的連接組合互相轉換

zip spa extend 連接 style += xtend lis int 本篇總結了一下字符串,列表,字典,元組的連接組合使用和類型的互相轉換小例子,尤其列表中的extend()方法和字典中的 update方法非常的常用。 1.連接兩個字符串 a = "hello

【轉】 Python列表、元組、集合、字典的區別相互轉換

tail 互轉 http pen append color class div 交集 原文鏈接:https://blog.csdn.net/lilongsy/article/details/70895753 列表取交集: a=[1,2,3] b=[2] print(li

pythonstr字符串 list列表基本操作總結

叠代 組成 結束 enter eve 字符 元素 rip move s = ‘#afsfdf222#‘print(s.capitalize()) # 首字母大寫其他字母小寫print(s.center(20, ‘%‘)) # 居中並在空白處添加指定字符print(

RGBHSV區別互相轉換

先了解下RGB和HSV 區別 1. RGB模型。 三維座標: RGB:三原色         Red, Green, Blue原點到白色頂點的中軸線是灰度線,r、g、b三分量相等,強度可以由三分量的向量表示。 用RGB來理解色彩、深淺、明暗變化: 色彩變化: 三個座標

python 序列型別以及list(列表) tuple(元組)詳解 以及range的用法

參考: #################################################################### 序列:成員是有序排列,可以通過下標偏移量訪問到它的一個或多個成員 在python中有六種內建的序列:列表、元素、字串、

判斷主機、網絡字節序互相轉換

9.1 判斷 gpo 位數 signed 轉換 pad bsp amp 大端字節序(big-endian):按照內存地址的增長方向,高位數據儲存於低位地址。 小端字節序(little-endian):按照內存地址增長方向,高位數據儲存於高位地址。 判斷主機、網絡字節序:

構建分離解析的域名服務器,以及實現SNATDNAT 轉換

ret for bsp all 網關 span onf tor refresh 分離解析(Split DNS)的域名服務器實際也是主域名服務器,這裏主要是指根據不同的客戶端提供不同的域名解析記錄。來自不同地址的客戶機請求解析同一域名時,為其提供不同的解析結果。 實驗準

寬字元wchar_t窄字元char區別相互轉換

轉自:http://blog.csdn.net/nodeathphoenix/article/details/7416725   1.    首先,說下窄字元char了,大家都很清楚,就是8bit表示的byte,長度固定。char字元只能表示ASII碼

[收集]ANSI字元與Unicode字元的互相轉換

二、雙位元組字串轉單位元組字串(比如LPWSTR轉char*、wstring|wchar_t*轉換為string|char*)//wstring轉換為string: string ConverWStringToString(wstring wstr) { int size=WideCharToMu

[轉]QWidget QMainWindow QDialog的區別相互轉換

QWidget類是所有使用者介面物件的基類。 視窗部件是使用者介面的一個原子:它從視窗系統接收滑鼠、鍵盤和其它事件,並且在螢幕上繪製自己的表現。每一個視窗部件都是矩形,並且它們按Z軸順序排列的。一個視窗部件可以被它的父視窗部件或者它前面的視窗部件蓋住一部分。 QMai

jQuery物件dom物件的區別相互轉換

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> <html> <head> <title>obj.html</title>

python 字符串編碼 strunicode 區別以及相互轉化 decode('utf-8') encode('utf-8')

encode unicode 字符串 code com bubuko src 區別 分享圖片 python 字符串編碼 str和unicode 區別以及相互轉化 decode('utf-8') encode('utf-8'

Python 字串(str)列表(list)的互相轉換

1.str >>>list  str1 = "12345" list1 = list(str1) print list1 str2 = "123 sjhid dhi" list2 = str2.sp

python知識整理--議可變物件不可變物件以及str、list、tuple、dict、set

可變物件:變數、list 不可變物件:str、tuple、dict、set 1、變數是可變的不用多說,變數賦值一次便改變一次。 2、list 可變物件,可對list進行如下新增刪除排序等操作。 list = [2,3,5,1,2] list.append(8) list.insert(0,

python strunicodeunicodestr

str轉Unicode: strtypeE.decode('gbk') unicode轉str: unicodetypeE.encode('gbk') 有時程式會報這樣的錯誤: Unicode equal comparison failed to convert both a

python strbytes 互相轉換

# 位元組 物件 b = b"lishaoshu" # str 物件 s = "lishaoshu" # str to bytes sb = bytes(s, encoding = "utf8") # bytes to str bs = str(b,

python學習之路-字串(str列表(list)的互相轉換

1.str >>>list str1 = "12345" list1 = list(str1) print list1 str2 = "123 sjhid dhi"

python函式——編碼問題——strUnicode區別

一篇關於STR和UNICODE的好文章 整理下python編碼相關的內容 注意: 以下討論為Python2.x版本, Py3k的待嘗試 開始 用python處理中文時,讀取檔案或訊息,http引數等等,一執行,發現亂碼(字串處理,讀寫檔案,print),然後,大多