1. 程式人生 > >【Python】Python爬蟲之Selector選擇器

【Python】Python爬蟲之Selector選擇器

XPath 語法
XPath 使用路徑表示式來選取 XML 文件中的節點或節點集。節點是通過沿著路徑 (path) 或者步 (steps) 來選取的。
XML 例項文件
我們將在下面的例子中使用這個 XML 文件。

<?xml version="1.0" encoding="UTF-8"?>
<bookstore>

<book>
  <title lang="eng">Harry Potter</title>
  <price>29.99</price>
</book>

<book>
<title lang="eng">Learning XML</title> <price>39.95</price> </book> </bookstore>

選取節點
XPath 使用路徑表示式在 XML 文件中選取節點。節點是通過沿著路徑或者 step 來選取的。 下面列出了最有用的路徑表示式:
表示式 描述
這裡寫圖片描述

在下面的表格中,我們已列出了一些路徑表示式以及表示式的結果:
路徑表示式 結果
這裡寫圖片描述

謂語(Predicates)
謂語用來查詢某個特定的節點或者包含某個指定的值的節點。
謂語被嵌在方括號中。
在下面的表格中,我們列出了帶有謂語的一些路徑表示式,以及表示式的結果:
路徑表示式 結果
這裡寫圖片描述


選取未知節點
XPath 萬用字元可用來選取未知的 XML 元素。
萬用字元 描述
這裡寫圖片描述

在下面的表格中,我們列出了一些路徑表示式,以及這些表示式的結果:
路徑表示式 結果
這裡寫圖片描述
選取若干路徑
通過在路徑表示式中使用”|”運算子,您可以選取若干個路徑。
在下面的表格中,我們列出了一些路徑表示式,以及這些表示式的結果:
路徑表示式 結果
這裡寫圖片描述