1. 程式人生 > >Python,將Unicode16進位制編碼轉換為漢字方式和注意點

Python,將Unicode16進位制編碼轉換為漢字方式和注意點

第一種:

eval1 = eval("u" + "\'" + text + "\'")

第二種

b = bytes("abc", 'utf8')

print(b.decode('utf8'))

第三種 和第一種一樣

a = '\u5386\u9633\u9547'

爬蟲得到的如上字串 若想輸出時候返回中文字元解決方法如下:

a = "u'"+a+"'"

print(eval(a)) 歷陽鎮

第4中 注意情況,這裡的字元物件包含了 單引號   '  ' 

a = """  '\u5386\u9633\u9547'

   """

a = "u"+a 

 

原理: eval( str ) str為字串格式, str 的最終字元為 """  u '\u5386\u9633\u9547'   """

注意: 有時候在網上爬蟲的資料字串為  '\u5386\u9633\u9547'    注意 這裡的字串包含

英文單引號 '   ' , 所以: 此時 只需要 字元 'u' + 包含單引號的字元變數 即可。還有就是eval 中的 

字串必須是 " u' " + Unicode 編碼格式的字串+" ' ", 不能出現其他 非Unicode的字元,否則會報錯。