1. 程式人生 > >pythong中" "的編碼和解碼處理

pythong中" "的編碼和解碼處理

“&nbsp”在 html 裡是空格佔位符,普通的空格在 html 裡如果連續的多個可能被認為只有一個,而”&nbsp”你寫幾個就能佔幾個空格位
而當Python對HTML中的”&nbsp”進行解析轉碼時,會出現無法正確編碼的情況。
此時在轉換的時候必須一些前置動作。

string.replace(u’\xa0’, u’ ‘)

將’\xa0‘替換成u’ ‘空格,這個\xa0就是那個html中的&nbps空格