1. 程式人生 > >圖片爬取和思路分析

圖片爬取和思路分析

pen key compile cat file grid 數據 ret info

//我先準備一個記事本準備頁面網址

技術分享圖片

s=頁數

q=搜索值

//爬取相對的網頁數據

技術分享圖片

//找到圖片的網址在源代碼中ctrl+f 找到TB1xjf5dFhM8kjiszfwxxcib的代碼復制用正則精準爬取

//遍歷結果

import urllib.request
import re
suo="夾克男"
key=urllib.request.quote(suo)
for i in range(0,1):
url="http://s.taobao.com/list?spm=a21bo.2017.201867-links-0.5.5af911d9M4bXRK&q="+str(key)+"&cat=16&style=grid&seller_type=taobao&bcoffset=12&s="+str(i*60)
jie=urllib.request.urlopen(url).read().decode("utf-8","ignore")
string=‘"pic_url":"//(.*?)"‘
go=re.compile(string).findall(str(jie))
for j in range(len(go)):
temg=go[i]
temg1="http://"+temg
dom="D:/image/"+str(i)+str(j)+".jpg"
urllib.request.urlretrieve(temg1,filename=dom)

圖片爬取和思路分析