Python爬取網站美女照片

阿新 • • 發佈：2018-11-11

上次無意之中看到一個網站，裡面全是美女的照片，我就心想，哪天有時間了得把這網站的所有美女照片都得爬下來。今天有時間，寫了點程式碼，爬去了網站的所有照片。附上戰果！圖片實在是太多了，爬了一個多小時，還在爬....

先附上所有的原始碼：

# -*- coding: utf-8 -*-
"""
Created on Fri Nov  9 17:07:44 2018
@author: 小謝
"""
import requests
from bs4 import BeautifulSoup
import os
import random
import csv
import time
urls=[]
datas=[]
i=0
def Download(name,url,dirname):
    dir=dirname+"//"
    path=os.path.join(dir,name)
    print(path)
    response=requests.get(url)
    try:
        with open(path,"wb") as f:
            f.write(response.content)
            f.close()
            global i
            i=i+1
    except Exception as e:
        print(e)   
#獲取每一個分類的URL和名字
def Geturl():
    resp=requests.get("http://www.27270.com/ent/meinvtupian/")
    resp.encoding="gbk"  #設定網頁編碼
    html=resp.text
    soup=BeautifulSoup(html,"html.parser")
    divSoup1=soup.find("div",attrs={"id":"NewTagListBox"})
    aas=divSoup1.find_all("a")
    for a in aas:
        tup=(a['href'],a.string)
        urls.append(tup)  #將主頁面的各個分欄的連結和名字加入urls元組中
def GetImages(url,dirname):
    if os.path.exists(dirname):
        pass
    else:
        os.mkdir(dirname)   #建立目錄
    resp=requests.get(url)
    resp.encoding="gbk"  #設定網頁編碼
    html=resp.text
    soup=BeautifulSoup(html,"html.parser")
    divSoup=soup.find("ul",attrs={'id':'Tag_list'})
    lis=divSoup.find_all("li")
    file=open("meinv.csv","a",newline="")
    csv_writer=csv.writer(file)
    for li in lis:
        img=li.find("img")
        alt=img['alt']
        name=alt+".jpg"      #圖片的名字
        src=img['src']       #圖片的下載地址
        tup=(name,src)
        datas.append(tup)
        for data in datas:
            csv_writer.writerow(data)
            Download(data[0],data[1],dirname)
    file.close()
def main():
    Geturl()
    for url in urls:
        ur=url[0][:-5]    #將每個分欄的url連結去除最後的 .html
        for i in range(11):
            i+=1
            if i==1:
                uuu=ur+".html"
                try:
                    GetImages(uuu,url[1])
                except Exception as e:
                    print("異常物件的型別是：%s"%type(e))
                    print("異常物件的內容是：%s"%type(e))
            else:
                uuu=ur+"_"+str(i)+"html"
                try:
                    GetImages(uuu,url[1])
                except Exception as e:
                    print("異常物件的型別是：%s"%type(e))
                    print("異常物件的內容是：%s"%type(e))
start=time.time()
main()
end=time.time()
miao=end-start
i=str(i)
print("一共爬去了%s張圖片，花費了%s秒的時間！"%(i,miao))

網站連結：http://www.27270.com/ent/meinvtupian/

爬取網站的第一步，就是先分析網站的結構。我們可以看到，上面這裡有分類

我們右鍵檢查元素，發現這些分類都有規律

我們寫一個函式獲得每個分類的連結和名字，將連結和名字以元組的形式儲存在我們的全域性變數 urls中

def Geturl():
    resp=requests.get("http://www.27270.com/ent/meinvtupian/")
    resp.encoding="gbk"  #設定網頁編碼
    html=resp.text
    soup=BeautifulSoup(html,"html.parser")
    divSoup1=soup.find("div",attrs={"id":"NewTagListBox"})
    aas=divSoup1.find_all("a")
    for a in aas:
        tup=(a['href'],a.string)
        urls.append(tup)  #將主頁面的各個分欄的連結和名字加入urls元組中

然後我們開始分析每一個分類的規律了，每一個分類都有很多欄，而每一個欄的url都有規律。

http://www.27270.com/tag/875.html
http://www.27270.com/tag/875_2.html
http://www.27270.com/tag/875_3.html
......

所有我們得構造每一個分類的連結，因為每一個分類的欄目數量不同，所以我們選了最多的11

def main():
    Geturl()
    for url in urls:
        ur=url[0][:-5]    #將每個分欄的url連結去除最後的 .html
        for i in range(11):
            i+=1
            if i==1:
                uuu=ur+".html"
                try:
                    GetImages(uuu,url[1])
                except Exception as e:
                    print("異常物件的型別是：%s"%type(e))
                    print("異常物件的內容是：%s"%type(e))
            else:
                uuu=ur+"_"+str(i)+"html"
                try:
                    GetImages(uuu,url[1])
                except Exception as e:
                    print("異常物件的型別是：%s"%type(e))
                    print("異常物件的內容是：%s"%type(e))

接下來的函式是獲取圖片的URL和名字，

def GetImages(url,dirname):
    if os.path.exists(dirname):
        pass
    else:
        os.mkdir(dirname)   #建立目錄
    resp=requests.get(url)
    resp.encoding="gbk"  #設定網頁編碼
    html=resp.text
    soup=BeautifulSoup(html,"html.parser")
    divSoup=soup.find("ul",attrs={'id':'Tag_list'})
    lis=divSoup.find_all("li")
    file=open("meinv.csv","a",newline="")
    csv_writer=csv.writer(file)
    for li in lis:
        img=li.find("img")
        alt=img['alt']
        name=alt+".jpg"      #圖片的名字
        src=img['src']       #圖片的下載地址
        tup=(name,src)
        datas.append(tup)
        for data in datas:
            csv_writer.writerow(data)
            Download(data[0],data[1],dirname)
    file.close()

最後這個函式是下載圖片

def Download(name,url,dirname):
    dir=dirname+"//"
    path=os.path.join(dir,name)
    print(path)
    response=requests.get(url)
    try:
        with open(path,"wb") as f:
            f.write(response.content)
            f.close()
            global i
            i=i+1
    except Exception as e:
        print(e)

Python爬取網站美女照片

上次無意之中看到一個網站，裡面全是美女的照片，我就心想，哪天有時間了得把這網站的所有美女照片都得爬下來。今天有時間，寫了點程式碼，爬去了網站的所有照片。附上戰果！圖片實在是太多了，爬了一個多小時，還在爬.... 先附上所有的原始碼： # -*- coding: utf-8 -*-

分手後，小夥怒用Python爬取上萬空姐照片，贏取校花選舉大賽！

代碼美女圖片 pst caption alt .... 不出 ima bee 首先展示下Python爬取到的成果：我做什麽都要爭第一，這次的校花投票選舉大賽也不例外，雖然我是個男的......但是我看到了前女友竟然已經有三百多票排到第三名了，我怎麽能眼睜

python爬取網站上的圖片並儲存到本地

　　1.匯入需要的模組requests，BeautifulSoup，os（用於檔案讀寫）。　　2.建立一個類，並初始化。 class BeautifulPicture: def __init__(self): # 類的初始化操作 self.headers = {

python 爬取網站獲得一個網站的所有連結

第一步，找個網站我這裡就找行業裡比較有名的收錄網站的網站酷113網第二步，開啟www.ku113.com 按下滑鼠右鍵點選檢視原始碼第三步，把原始碼複製下來儲存成一個檔案命名 ku113.html 第四步，執行以下python 程式我這裡用的py 2.7.13版

java網路程式設計____最簡單的爬蟲(爬取網站美女圖片)

package com.company.reptile; import java.io.BufferedReader; import java.io.DataInputStream; import java.io.File; import java.io.FileOutpu

使用Python爬取網站圖片

最終程式碼：import requests import json import urllib def getSogouImag(category,length,path): n = length cate = category imgs = requests.get('http://pic.sogou.co

python爬取網站m3u8視訊，將ts解密成mp4，合併成整體視訊

一些網站會提供m3u8視訊地址，以供下載觀看。或者一些網站經過分析後發現是使用m3u8格式進行播放的，這時使用m3u8的地址連結就可以下載到相應的視訊。一、關於m3u8：（https://blog.csdn.net/baidu_34418350/article/details

python爬蟲：爬取網站視頻

爬蟲 python python爬取百思不得姐網站視頻：http://www.budejie.com/video/新建一個py文件，代碼如下：#!/usr/bin/python # -*- coding: UTF-8 -*- import urllib,re,requests import sys

Python 爬取美女圖片，分目錄多級存儲

port Language resp pac rst apt itl album domain 最近有個需求：下載https://mm.meiji2.com/網站的圖片。所以簡單研究了一下爬蟲。在此整理一下結果，一為自己記錄，二給後人一些方向。爬取結果如圖：

Python爬取異步加載的網站selenium+PhantomJS

ron .com .html scrip psu 語言 sel 文字 get 一個網站的爬蟲腳本，在調試的時候發現問題：腳本跑：content-type用text/xml 可以post成功，但post中body的內容沒有生效，所有的響應都是當前日期；用applicatio

Python 利用 BeautifulSoup 爬取網站獲取新聞流

lxml odi creat times 對比文件中 lse win 危機 0. 引言　　介紹下 Python 用 Beautiful Soup 周期性爬取 xxx 網站獲取新聞流；圖 1 項目介紹 1. 開發環境　　Python：　　　　

Python爬蟲：爬取網站電影資訊

以爬取電影天堂喜劇片前5頁資訊為例，程式碼如下： 1 # coding:UTF-8 2 3 import requests 4 import re 5 6 def mov(): 7 headers={'User-Agent':'Mozilla/5.0 (Windo

python 爬取新浪網站 NBA球員最近2個賽季庫裡前20場資料

1. 分析新浪網站中球員資料的獲取方式(F12 開發者模式，除錯網頁)：一般網站儲存資料的方式分為2種：1. 靜態網頁儲存；2. 動態請求；對於靜態網頁儲存來說，就是開啟瀏覽器中檢視原始碼，就可以從原始碼中獲取所需要的資料；對於動態請求來說，採用F12的開發者模式中，才能從伺服器的

用python爬取美女圖片

import urllib.request import os for i in range(2000, 2400): if not os.path.exists(‘tupian/’ + str(i)): os.makedirs(‘tupian/’ + str(i)) for j in

Python爬取小說網站頁面製作電子書

#-*- coding:utf-8 -*- from bs4 import BeautifulSoup from urlparse import urljoin import requests url="http://www.jinyongwang.com/yi/{page}.html

python爬取古詩文網站詩文一欄的所有詩詞

寫在前面曾經，我們都有夢，關於文學，關於愛情，關於一場穿越世界的旅行，如今我們深夜飲酒，杯子碰在一起，都是夢破碎的聲音曾經，面對詩文如痴如醉，而如今，已漠眼闌珊，風起雲湧不再，嗚呼哀哉，索一首詩篇以慰藉爍爍華年卷一前幾日，發現古詩文網站，如獲至寶，便被一時私念驅使，將

Python爬蟲——爬取網站的例項化原始碼

缺點：1爬了一個網站好幾次以後不能再進行爬取。沒有解決這個問題 2在寫入資料的時候還是存在很大問題。以後多加練習這個檔案的儲存的相關工作 import re import urllib.request def function(): """需求：1 https://re

python 爬蟲如何通過scrapy框架簡單爬取網站資訊--以51job為例

Scrapy框架三大優點： Scrapy框架是用純Python實現一個為了爬取網站資料、提取結構性資料而編寫的應用框架，用途非常廣泛。框架的力量，使用者只需要定製開發幾個模組就可以輕鬆的實現一個爬蟲，用來抓取網頁內容以及各種圖片，非常之方便。 Scrapy

Python爬取黑龍江科技大學URL教務網站

這個小東西從去年的寒假開始寫，直到現在才寫完，就是因為自己太懶了，不愛寫大概的框架是用urllib庫中的requests寫的，本來想用scrapy來寫的，但是scrapy庫沒有安裝好,所以只能用前者來寫。其實requests庫還是很方便的。主要用來做POST請求。

教你如何用Python爬取美女圖片

Python爬取美女圖片今天我寫的一個小爬蟲是爬取美女的圖片，想必大家都喜歡，這個都懂。。。利用python爬蟲爬取圖片，首先要進行安裝python 安裝python之後，在進行安裝第三方庫，requests,bs4,lxml這三個庫。。。在cmd中進行

Python爬取網站美女照片

相關推薦