Python爬蟲爬取OA幸運飛艇平臺獲取數據

阿新 • • 發佈：2018-06-25

sta 獲取數據 status fail attrs color wrapper 排行榜 req

安裝BeautifulSoup以及requests

打開window 的cmd窗口輸入命令pip install requests 執行安裝，等待他安裝完成就可以了

BeautifulSoup庫也是同樣的方法

我使用的編譯器的是sublime text 3，覺得是挺好用的一個編譯軟件

其他工具： Chrome瀏覽器

Python版本： Python3.6

運行平臺： Windows

1、首先我們搜索OA幸運飛艇平臺排行榜：【×××。com/h5】企娥:217 1793 408
技術分享圖片
獲取網頁的代碼：

[python] view plain copy
def getHTMLText(url,k):
try:

if(k==0):
a={}
else:
a={‘offset‘:k}
r = requests.get(url,params=a,headers={‘User-Agent‘: ‘Mozilla/4.0‘})
r.raise_for_status()
r.encoding = r.apparent_encoding
return r.text
except:
print("Failed!")
經過觀察其中因為每一頁的網址其offset都不相同，故只要改變offset=k便可獲取每一頁的信息

通過main函數以改變URL：

[python] view plain copy

def main():
basicurl=‘×××。com/h5‘
k=0
while k<=100:
html=getHTMLText(basicurl,k)
k+=10
getname(html)
通過BeautifulSoup的方法層層獲取標簽中的信息，並for循環輸出

[python] view plain copy
def getname(html):
soup = BeautifulSoup(html, "html.parser")
paihangList=soup.find(‘dl‘,attrs={‘class‘:‘board-wrapper‘})

mov=[]
actor=[]
for movlist in paihangList.find_all(‘dd‘):
movitem=movlist.find(‘div‘,attrs={‘class‘:‘movie-item-info‘})
movname=movitem.find(‘p‘,attrs={‘class‘:‘name‘}).getText()
actors=movlist.find(‘div‘,attrs={‘class‘:‘board-item-main‘})
actorname=actors.find(‘p‘,attrs={‘class‘:‘star‘}).getText()
b=actorname.replace(‘\n‘,‘‘)
c=b.replace(‘ ‘,‘‘)
actor.append(c)
mov.append(movname)
mode= "{0:<30}\t{1:<50}"
for i,j in zip(mov,actor):
print(mode.format(i,j,chr(12288)))

Python爬蟲爬取OA幸運飛艇平臺獲取數據

sta 獲取數據 status fail attrs color wrapper 排行榜 req 安裝BeautifulSoup以及requests 打開window 的cmd窗口輸入命令pip install requests 執行安裝，等待他安裝完成就可以了 Beaut

Python爬蟲爬取OA幸運飛艇平臺獲取數據

Python爬蟲爬取OA幸運飛艇平臺獲取數據

python爬蟲爬取各大平臺女主播圖片

Python爬蟲-爬取糗事百科段子

python爬蟲爬取頁面源碼在本頁面展示

python 爬蟲爬取證券之星網站

python爬蟲爬取海量病毒文件

用Python爬蟲爬取廣州大學教務系統的成績（內網訪問）

python爬蟲——爬取古詩詞

使用Python的BeautifulSoup庫實現一個可以爬取1000條百度百科數據的爬蟲

利用Python爬蟲爬取淘寶商品做數據挖掘分析實戰篇，超詳細教程

Python開發簡單爬蟲之靜態網頁抓取篇：爬取“豆瓣電影 Top 250”電影數據

Python爬蟲 - 爬取百度html代碼前200行

簡易python爬蟲爬取boss直聘職位，並寫入excel

Python 爬蟲爬取微信文章

python爬蟲爬取QQ說說並且生成詞雲圖，回憶滿滿！

ARM40-A5應用——Shell腳本OA幸運飛艇平臺搭建實現進程自動拉起

利用python爬蟲爬取圖片並且制作馬賽克拼圖

Python爬蟲學習筆記（七）——智高考數據爬取

Python - 爬蟲爬取和登陸github

用Python爬蟲爬取豆瓣電影、讀書Top250並排序

Python爬蟲爬取OA幸運飛艇平臺獲取數據

相關推薦