1. 程式人生 > >爬蟲(2)

爬蟲(2)

結合 span 表達式 安裝 src ins tree path 方法

一、XPATH解析和案例

  XPATH是解析方式中最重要的一種。

1、環境安裝

  pip install lxml

2、解析原理

  - 獲取頁面源碼數據

  - 實例化一個etree的對象,並且將頁面源碼數據加載到該對象中

  - 調用該對象的xpath方法進行指定標簽的定位

  - 註意:xpath函數必須結合著xpath表達式進行標簽定位和內容捕獲

3、xpath表達式

技術分享圖片

4、5個案例

  1)解析58二手房的相關數據

5、xpath插件安裝

  1)按照下圖步驟點擊擴展程序

技術分享圖片

  2)將開發者模式打開

技術分享圖片

  3)點擊添加擴展程序

技術分享圖片

  4)此時重啟瀏覽器,按"ctrl + shift + x",便可使用插件驗證xpath表達式

爬蟲(2)