1. 程式人生 > >爬蟲相關知識(二 )xpath

爬蟲相關知識(二 )xpath

點名 節點 style 路徑 name 相對路徑 span 名稱 格式

#xpath表達式的基本格式

# 斜杠(/)作為路徑內部的分割符。

# 同一個節點有絕對路徑和相對路徑兩種寫法。

# 絕對路徑(absolute path)必須用"/"起首,後面緊跟根節點,比如/step/step/...。

# 相對路徑(relative path)則是除了絕對路徑以外的其他寫法,比如 step/step,也就是不使用"/"起首。

# "."表示當前節點。

# ".."表示當前節點的父節點
選擇節點的基本規則

- nodename(節點名稱):表示選擇該節點的所有子節點

- "/":表示選擇根節點

- "//":表示選擇任意位置的某個節點

- "@": 表示選擇某個屬性
通配符

# "*"表示匹配任何元素節點。

# "@*"表示匹配任何屬性值。
 //title[@*] :表示選擇所有帶有屬性的title元素。
 # node()表示匹配任何類型的節點。 
選擇多個路徑

用"|"選擇多個並列的路徑。

//book/title | //book/price :表示同時選擇book元素的title子元素和price子元素。

爬蟲相關知識(二 )xpath