1. 程式人生 > >python處理html中的以&#開頭的編碼

python處理html中的以&#開頭的編碼

亂碼格式類似‘图灵程序设计丛书’

程式碼為:

text='图灵程序设计丛书'
text=text.replace('&#','')
text=[i for i in text.split(';') if i]
text=[hex(int(i)) for i in text]
text=[i.replace('0x','') for i in text]
string=' '
flag='\\u'
for i in text:
                string+=flag+format(i,'0>4s')
print(string.encode('utf-8').decode('unicode-escape'))