1. 程式人生 > >Python抓取京東手機的配置資訊

Python抓取京東手機的配置資訊

以下程式碼是使用python抓取京東小米8手機的配置資訊

然後找到其配置資訊的標籤,我們找到其配置資訊的標籤為 <div  class="Ptable"> 

然後再分析其配置資訊的頁面的規律,我們發現都是一個dt對應的一個dd,dt對應的是引數,dd對應的是引數具體的值

 

下面是原始碼

import requests
from bs4 import BeautifulSoup
from pandas import Series
from pandas import DataFrame


response=requests.get("https://item.jd.com/7437788.html")
html=response.text

soup=BeautifulSoup(html,"html.parser")
divSoup=soup.find("div",attrs={"class","Ptable"})  ##找到其配置資訊的標籤

data=DataFrame(columns=["引數","值"])      #定義一個二元的DataFrame
dls=divSoup.find_all("dl")

for dl in dls:
    dts=dl.find_all("dt")
    dds=dl.find_all("dd")
    if len(dts)==len(dds):
        for i in range(len(dts)):
            f=dts[i].getText();
            p=dds[i].getText();
            data=data.append(Series([f,p],index=["引數","值"]),ignore_index=True);
print(data)

這是最終抓取到的配置資訊,一共有64行,這裡我就不一一列舉出來了