1. 程式人生 > >python爬蟲系列(3.1-xpath語法的介紹)

python爬蟲系列(3.1-xpath語法的介紹)

一、關於xpath的認識

xpath(XML Path Language)是一門在XML和HTML文件中查詢資訊的語言,可用來在XML和HTML文件中對元素和屬性進行遍歷。

二、xpath的基本語法

1、選擇節點

 


2、謂語

謂語是用來找出某個特定的節點或者包括某個指定的值的節點,被巢狀在方括號中

 


3、萬用字元

類似.在正則中表示任意字元的意思,但是在xpath中是用*表示

 


4、匹配多路徑

//div/a | //div/img

# 表示獲取div下面的a節點及div下面的img節點