Python抓取京東手機的配置資訊
阿新 • • 發佈:2018-12-15
以下程式碼是使用python抓取京東小米8手機的配置資訊
然後找到其配置資訊的標籤,我們找到其配置資訊的標籤為 <div class="Ptable">
然後再分析其配置資訊的頁面的規律,我們發現都是一個dt對應的一個dd,dt對應的是引數,dd對應的是引數具體的值
下面是原始碼
import requests from bs4 import BeautifulSoup from pandas import Series from pandas import DataFrame response=requests.get("https://item.jd.com/7437788.html") html=response.text soup=BeautifulSoup(html,"html.parser") divSoup=soup.find("div",attrs={"class","Ptable"}) ##找到其配置資訊的標籤 data=DataFrame(columns=["引數","值"]) #定義一個二元的DataFrame dls=divSoup.find_all("dl") for dl in dls: dts=dl.find_all("dt") dds=dl.find_all("dd") if len(dts)==len(dds): for i in range(len(dts)): f=dts[i].getText(); p=dds[i].getText(); data=data.append(Series([f,p],index=["引數","值"]),ignore_index=True); print(data)
這是最終抓取到的配置資訊,一共有64行,這裡我就不一一列舉出來了