1. 程式人生 > >python對utf-8的中文轉換

python對utf-8的中文轉換

python3預設支援utf-8,因此對於\uXXXX這種格式的中文,可以直接轉換,但經常爬蟲抓取回來的中文是\uXXXX格式,因此需要進行轉換

s1='\u70ed\u95e8\u94ed\u6587\u63a8\u8350'
print('s1=',s1)

s2='\\u70ed\\u95e8\\u94ed\\u6587\\u63a8\\u8350'
print('s2=',s2)

s3=s2.encode('utf-8').decode('unicode_escape')
print('s3=',s3)
s1= 熱門銘文推薦
s2= \u70ed\u95e8\u94ed\u6587\u63a8\u8350
s3= 熱門銘文推薦