1. 程式人生 > >python3爬蟲基礎-pyquery解析庫

python3爬蟲基礎-pyquery解析庫

簡介

看名稱和jQuery比較接近,對沒錯,pyQuery允許您對XML文件進行jQuery查詢。API儘可能類似於jQuery。pyquery使用lxml進行快速XML和html操作。支援CSS選擇器,操作在查詢和操作HTML上是非常便捷的。

安裝和使用

直接使用pip即可安裝

pip install pyquery

URL初始化

# -*- coding: utf-8 -*-
from pyquery import PyQuery as pq                           # 引入 pyquery 並設定別名
html_obj = pq('<html>this is test</html>')                  # html字元初始化物件
url_obj = pq(url='http://www.python.org',encoding='gbk')    # URL初始化物件
local_obj = pq(filename='test.html',encoding='gbk')         # 本地檔案初始化物件

print(html_obj)                                             # 所有內容
print(url_obj('head'))                                      # 根據CSS標籤型別選擇
print(local_obj('#ID_01 .class_01 p'))                      # 根據CSS選擇器來選擇

==更多選擇器請參考博文==

  • 《jQuery基礎 - 常用基本屬性》
  • 《jQuery基礎 - 選擇器》
  • 《jQuery基礎 - 篩選器》

官方文件

https://pyquery.readthedocs.io