Python爬蟲教程-25-數據提取-BeautifulSoup4(三)
阿新 • • 發佈:2018-09-06
運行 .com div 分享 size content bs4 text ont
- 本筆記不允許任何個人和組織轉載
Python爬蟲教程-25-數據提取-BeautifulSoup4(三)
本篇介紹 BeautifulSoup 中的 css 選擇器
css 選擇器
- 使用 soup.select 返回一個列表
- 通過標簽名稱:soup.select("title")
- 通過類名:soup.select(".centent")
- id 查找:soup.select("#name_id")
- 組合查找:soup.select("div #input_content")
- 屬性查找:soup.select("img[class=‘photo‘]")
獲取tag內容:tag.get_text
案例
- 代碼27bs5.py文件:https://xpwi.github.io/py/py%E7%88%AC%E8%99%AB/py27bs5.py
# BeautifulSoup 的使用案例 # css 選擇器 from urllib import request from bs4 import BeautifulSoup url = ‘http://www.baidu.com/‘ rsp = request.urlopen(url) content = rsp.read() soup = BeautifulSoup(content, ‘lxml‘) # bs 自動解碼 content = soup.prettify() print("=="*12) titles = soup.select("title") print(titles[0]) print("=="*12) meta = soup.select("meta[content=‘always‘]") print(meta[0])
運行結果
- 本筆記不允許任何個人和組織轉載
Python爬蟲教程-25-數據提取-BeautifulSoup4(三)