1. 程式人生 > >用python 爬取網頁圖片

用python 爬取網頁圖片

import re
import string
import sys
import os
import urllib

url="http://tieba.baidu.com/p/2521298181"#這個是某貼吧地址
imgcontent=urllib.urlopen(url).read()#抓取網頁內容
reg = r'src="(.+?\.jpg)" pic_ext'
imgre = re.compile(reg)
urllist = imgre.findall(imgcontent)
#urllist=re.findall(r'src="(http.+?\.jpg)"',imgcontent,re.I)#提取圖片連結
if not urllist:
	print 'not found...'
else:
	#下載圖片,儲存在當前目錄的pythonimg資料夾下
	filepath=os.getcwd()+'\pythonimg'
	if os.path.exists(filepath) is False:
		os.mkdir(filepath)
	x=1
	print u'爬蟲準備就緒...'
	for imgurl in urllist:
		temp= filepath + '\%s.jpg' % x
		print u'正在下載第%s張圖片' % x
		print imgurl
		urllib.urlretrieve(imgurl,temp)
		x+=1
	print u'圖片下載完畢,儲存路徑為'+filepath

為方便除錯python程式,下面貼出列印檔案、模組以及行號的功能:

import sys

print sys._getframe().f_code.co_filename #獲取當前檔名;
print sys._getframe().f_code_name #獲取函式名;
print sys._getframe().f_lineno  #當前行


相關推薦

python 網頁圖片

import re import string import sys import os import urllib url="http://tieba.baidu.com/p/2521298181"#這個是某貼吧地址 imgcontent=urllib.urlopen(

python網頁圖片

ima com col list https pytho 表達式 images 5% 在Python中使用正則表達式,一個小小的爬蟲,抓取百科詞條網頁的jpg圖片。下面就是我的代碼,作為參考: #coding=utf-8 # __author__ = ‘Hinfa‘ im

python美女圖片

import urllib.request import os for i in range(2000, 2400): if not os.path.exists(‘tupian/’ + str(i)): os.makedirs(‘tupian/’ + str(i)) for j in

Python網頁上的小說,讓你從此告別書荒!

eset 爬取網頁 網站 鏈接 表頭 寫入 改變 span 人生 人生苦短,我用Python。有道愛看小說的小夥伴們,在看小說的期間總會遇到那麽一段書荒期,在這段期間想看書卻找不到,要麽就是要VIP,要麽就是下載不了。所以學會爬取網站上的小說是很有必要的,今天就以爬取筆趣閣

使用Python網頁圖片

使用Python爬取網頁圖片 李曉文 21 天前 近一段時間在學習如何使用Python進行網路爬蟲,越來越覺得Python在處理爬蟲問題是非常便捷的,那麼接下來我就陸陸續續的將自己學習

Python 網頁圖片

     可以看到該頁面上每一個圖片點進去是一個套路連結,我想要爬取的是每一個套圖內的所有圖片。同時這個網頁是翻頁的,拉倒最後可以看到。      因此我需要獲取每一頁的html,從這個html中得到所有套圖的連結。下載所有套圖。     1、在Chrome瀏覽器中,點選

利用python網頁圖片

學習python爬取網頁圖片的時候,可以通過這個工具去批量下載你想要的圖片 開始正題: 我從尤物網去爬取我喜歡的女神的寫真照,我們這裡主要用到的就兩個模組 re和urllib模組,有的時候可能會用

第十講:Python網頁圖片並儲存到本地,包含次層頁面

上一講我們講到了從暱圖網的首頁下載圖片到本地,但是我們發現首頁上面的大部分連結其實都可以進入到二級頁面。 在二級頁面裡面,我們也

一個鹹魚的Python爬蟲之路(三):網頁圖片

you os.path odin 路徑 生成 存在 parent lose exist 學完Requests庫與Beautifulsoup庫我們今天來實戰一波,爬取網頁圖片。依照現在所學只能爬取圖片在html頁面的而不能爬取由JavaScript生成的圖。所以我找了這個網站

Python網頁圖片資料

本案例是基於PyCharm開發的,也可以使用idea。 在專案內新建一個python檔案TestCrawlers.py TestCrawlers.py # 匯入urllib下的request模組 import urllib.request # 匯入正則匹配包 import re

Python微博資料生成詞雲圖片

很早之前寫過一篇怎麼利用微博資料製作詞雲圖片出來,之前的寫得不完整,而且只能使用自己的資料,現在重新整理了一下,任何的微博資料都可以製作出來,放在今天應該比較應景。 一年一度的虐汪節,是繼續蹲在角落默默吃狗糧還是主動出擊告別單身汪加入散狗糧的行列就看你啦,七夕送什麼才有心意,程式猿可以試試用

python知乎中的圖片

首先,我們檢視一下知乎的robots協議。 User-agent: * Disallow: / 知乎是不允許爬取其根目錄的。 但是,我們只是用於實驗,而且訪問頻率和正常訪問差距不大,所以可以爬取。 先明確目的: 對手動輸入的網址進行解析 把爬取到的圖片儲存到指定目

python 網頁中的圖片到本地

最近在學習python,順便寫一個爬取網頁中圖片的程式練練手。 主要分為兩個過程: 第一,從給定域名的網頁中爬取圖片的連結 第二,讀取連結對應的圖片,儲存到本地 第一個過程需要匯入utllib包,在

python鬥圖啦圖片

一、程式碼部分 # -*- coding:utf-8 -*- '''1、python版本 python3.6 2、IDE PyCharm 2017.3 ''' import requests imp

python爬蟲小試例項--網頁圖片並下載

一、python安裝在python的官網下載python版本,需要下載對應版本(在計算機-屬性中檢視自己是32位作業系統還是64位作業系統),我是64位的,就下載64位對應的安裝包了(如下圖:Windows x86-64 executable installer)。官網下載地

Python——網路爬蟲(網頁圖片

最近在學習 Python, 然後就試著寫了一個簡單的Python小程式,爬取一個網頁的圖片,不得不說 Python 真的強大,以下是爬取 NEFU Online Judge 網站的程式碼。 吐槽:其實

Python爬蟲實戰(三):簡單網頁圖片

先上程式碼:#coding=utf-8 import urllib.request for i in range(1,41): imgurl = "http://mtl.ttsqgs.com/images/img/11552/" imgurl += str(i

python圖片的一點小結

一、原理小結 最近在學習用python的爬蟲爬取網路上的圖片,製作資料集並用於後續的一些實驗。看了很多關於python爬取圖片的介紹,並驗證了相關程式碼,先推薦幾個介紹比較好的爬蟲過程: 總體上來說,爬蟲的主要思路大致可以描述為: 1. 判斷待爬取網頁中的

簡單的網頁圖片

baidu alt idt ima 修改 利用 表達 輸入 html import reimport urllib.request# ------ 獲取網頁源代碼的方法 ---def getHtml(url): page = urllib.request.urlope

Python網易雲音樂上的Hip-hop歌單,分析rapper如何押韻

line gone 謠言 大致 -i 態度 大眾 其中 當前 緣起 《中國有嘻哈》這個節目在這個夏天吸引了無數的目光,也讓嘻哈走進了大眾的視野。作為我今年看的唯一一個綜藝節目,它對我的影響也蠻大。這個夏天,我基本都在杭州度過,在上下班的taxi上,我幾乎都在刷這個節目,最後