xpath簡單入門
阿新 • • 發佈:2018-01-04
pat concat school bsp class 技術 code pen .com
語法:
選取節點:
實例:
(貼圖轉載自w3school)
補充:
/a/@href #獲取a標簽的href屬性
當<div class="demo"></div>種情況的時候我們可以寫成/div[@class="demo"]
但如果是
<div class="demo1 demo2 demo3"></div>
這種情況我們如果匹配demo2就不能直接用等於的方法
可以用/div[contains(@class,‘demo2‘)]
如果選擇demo2和demo3
可以用/div[contains(@class,‘demo2‘) and contains(@class,‘demo3‘)]
/*網上的一個相關解答還有一個*/
如果目標Class不一定是第一個,那麽
//div[contains(concat(‘ ‘,@class,‘ ‘),‘demo‘)]
沒看明白,但是暫且保留
python下用lxml模塊
導入的時候只需要一個etree來接收就可以
import ...
from lxml import etree
...
html = urllib.request.urlopen(url)
content = etree.HTML(html)
cont_list = content.xpath(‘/div[@class="test"]‘)
//cont_list接收的是一個匹配成功的列表
xpath簡單入門