1. 程式人生 > >python爬蟲【二】爬取新聞

python爬蟲【二】爬取新聞

在一個新聞站點或者絢麗的網頁會有許多id和class 我們可以通過觀察來看到我們需要的資訊在那些id和class下

但是這裡介紹兩種快速便捷的方法

第一種使用谷歌瀏覽器自帶的開發者工具

 

 或者安裝infolite外掛安裝方法看這篇https://blog.csdn.net/viafcccy/article/details/85221588

點選開啟infolite工具

直接點選需要的位置就可出現相應的語句

 

可以看到紅色的和我們需要的不一樣是廣告

我們通過觀察可以發現

 

我們使用這兩個工具 就可以快速爬取指定的標籤

impot requests
from bs4 import BeautifulSoup
res = requests.get('url')
res.encoding = 'utf-8'
soup = BeautifulSoup(res.text,'html.parser')
for news in soup.select('.類的名稱'):
	if len(news.select('標籤名稱')) > 0:
		變數名 = news.select('.類名稱/標籤名')[0].text
		print(變數名)