【Python】Python爬蟲之Selector選擇器
阿新 • • 發佈:2018-12-26
XPath 語法
XPath 使用路徑表示式來選取 XML 文件中的節點或節點集。節點是通過沿著路徑 (path) 或者步 (steps) 來選取的。
XML 例項文件
我們將在下面的例子中使用這個 XML 文件。
<?xml version="1.0" encoding="UTF-8"?>
<bookstore>
<book>
<title lang="eng">Harry Potter</title>
<price>29.99</price>
</book>
<book>
<title lang="eng">Learning XML</title>
<price>39.95</price>
</book>
</bookstore>
選取節點
XPath 使用路徑表示式在 XML 文件中選取節點。節點是通過沿著路徑或者 step 來選取的。 下面列出了最有用的路徑表示式:
表示式 描述
在下面的表格中,我們已列出了一些路徑表示式以及表示式的結果:
路徑表示式 結果
謂語(Predicates)
謂語用來查詢某個特定的節點或者包含某個指定的值的節點。
謂語被嵌在方括號中。
在下面的表格中,我們列出了帶有謂語的一些路徑表示式,以及表示式的結果:
路徑表示式 結果
選取未知節點
XPath 萬用字元可用來選取未知的 XML 元素。
萬用字元 描述
在下面的表格中,我們列出了一些路徑表示式,以及這些表示式的結果:
路徑表示式 結果
選取若干路徑
通過在路徑表示式中使用”|”運算子,您可以選取若干個路徑。
在下面的表格中,我們列出了一些路徑表示式,以及這些表示式的結果:
路徑表示式 結果