1. 程式人生 > >xpath簡單入門

xpath簡單入門

pat concat school bsp class 技術 code pen .com

技術分享圖片

語法:

選取節點:

技術分享圖片

實例:

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片(貼圖轉載自w3school)


補充:

/a/@href #獲取a標簽的href屬性

當<div class="demo"></div>種情況的時候我們可以寫成/div[@class="demo"]

但如果是

<div class="demo1 demo2 demo3"></div>

這種情況我們如果匹配demo2就不能直接用等於的方法

可以用/div[contains(@class,‘demo2‘)]

如果選擇demo2和demo3

可以用/div[contains(@class,‘demo2‘) and contains(@class,‘demo3‘)]

/*網上的一個相關解答還有一個*/

如果目標Class不一定是第一個,那麽

//div[contains(concat(‘ ‘,@class,‘ ‘),‘demo‘)]

沒看明白,但是暫且保留


python下用lxml模塊

導入的時候只需要一個etree來接收就可以

import ...

from lxml import etree

...

html = urllib.request.urlopen(url)

content = etree.HTML(html)

cont_list = content.xpath(‘/div[@class="test"]‘)

//cont_list接收的是一個匹配成功的列表

xpath簡單入門