1. 程式人生 > >用python爬取鬥圖啦圖片

用python爬取鬥圖啦圖片

一、程式碼部分

# -*- coding:utf-8 -*-
'''1python版本 python3.6
2IDE PyCharm 2017.3
'''
import requests
import urllib.request
import re

#獲取每一個主頁面中的分類條目url連結
def get_page(num):
    html = requests.get("http://www.doutula.com/article/list/?page=)"+str(num)).text
    reg = '<a href="(.*?)" class="list-group-item'
urls = re.findall(reg, html) return urls #獲取分類條目中每個圖片的url連結 def get_pic(urls): html = requests.get(urls).text reg = '<img src="(.*?)" alt' urls = re.findall(reg, html, re.S) return urls #下載圖片 n=1 for x in range(2): print("正在下載第{}......".format(x+1)) for i in get_page(x): for
j in get_pic(i): pic_file = "D:/0PyCharmProject/pic/"+str(n)+".jpg" urllib.request.urlretrieve(j, pic_file) n = n + 1 print("下載完成,共下載{}張圖片".format(n-1))

二、執行結果


三、下載圖片