1. 程式人生 > >Python中escape和unescape

Python中escape和unescape

pre log sca body cap 網頁 blog 一個 abc

Python處理HTML轉義字符

在抓網頁數據經常遇到例如>或者 這種HTML轉義符,抓到字符串裏很是煩人。

  比方說一個從網頁中抓到的字符串

  p =‘<abc>‘

  用Python可以這樣處理:

  

import html
p = <abc>
txt= html.unescape(p)
print (txt)

  #這樣就得到了txt= ‘<abc>‘

  如果還想轉回去,可以這樣:
  

import cgi
q = cgi.escape(html)
print(q)

 

#這樣又回到了 html = ‘&lt;abc&gt‘

Python中escape和unescape