python3爬蟲基礎-pyquery解析庫
阿新 • • 發佈:2019-05-19
簡介
看名稱和jQuery比較接近,對沒錯,pyQuery允許您對XML文件進行jQuery查詢。API儘可能類似於jQuery。pyquery使用lxml進行快速XML和html操作。支援CSS選擇器,操作在查詢和操作HTML上是非常便捷的。
安裝和使用
直接使用pip即可安裝
pip install pyquery
URL初始化
# -*- coding: utf-8 -*- from pyquery import PyQuery as pq # 引入 pyquery 並設定別名 html_obj = pq('<html>this is test</html>') # html字元初始化物件 url_obj = pq(url='http://www.python.org',encoding='gbk') # URL初始化物件 local_obj = pq(filename='test.html',encoding='gbk') # 本地檔案初始化物件 print(html_obj) # 所有內容 print(url_obj('head')) # 根據CSS標籤型別選擇 print(local_obj('#ID_01 .class_01 p')) # 根據CSS選擇器來選擇
==更多選擇器請參考博文==
- 《jQuery基礎 - 常用基本屬性》
- 《jQuery基礎 - 選擇器》
- 《jQuery基礎 - 篩選器》
官方文件
https://pyquery.readthedocs.io