1. 程式人生 > >Python爬蟲教程-25-數據提取-BeautifulSoup4(三)

Python爬蟲教程-25-數據提取-BeautifulSoup4(三)

運行 .com div 分享 size content bs4 text ont

Python爬蟲教程-25-數據提取-BeautifulSoup4(三)

本篇介紹 BeautifulSoup 中的 css 選擇器

css 選擇器

  • 使用 soup.select 返回一個列表
  • 通過標簽名稱:soup.select("title")
  • 通過類名:soup.select(".centent")
  • id 查找:soup.select("#name_id")
  • 組合查找:soup.select("div #input_content")
  • 屬性查找:soup.select("img[class=‘photo‘]")
  • 獲取tag內容:tag.get_text

    案例

  • 代碼27bs5.py文件:https://xpwi.github.io/py/py%E7%88%AC%E8%99%AB/py27bs5.py
# BeautifulSoup 的使用案例
# css 選擇器

from urllib import request
from bs4 import BeautifulSoup


url = ‘http://www.baidu.com/‘

rsp = request.urlopen(url)
content = rsp.read()

soup = BeautifulSoup(content, ‘lxml‘)

# bs 自動解碼
content = soup.prettify()

print("=="*12)
titles = soup.select("title")
print(titles[0])

print("=="*12)
meta = soup.select("meta[content=‘always‘]")
print(meta[0])

運行結果

技術分享圖片


- 本筆記不允許任何個人和組織轉載

Python爬蟲教程-25-數據提取-BeautifulSoup4(三)