1. 程式人生 > >python接口自動化測試十八:使用bs4框架爬取圖片

python接口自動化測試十八:使用bs4框架爬取圖片

image import 解析器 批量 文件夾 自動化測試 接口 data- IT

# 爬圖片
# 目標網站:http://699pic.com/sousuo-218808-13-1.html
import requests
from bs4 import BeautifulSoup
import os
r = requests.get(‘http://699pic.com/sousuo-218808-13-1.html‘)

# r.content # 返回的是字節流

soup = BeautifulSoup(r.content, ‘html.parser‘) # 用html解析器,查找r.content

# tu = soup.find_all(‘img‘) # 查找所有的標簽名字為“img”的對象
tu = soup.find_all(class_="lazy") # 查找所有的標簽名字為“class_="lazy"”的對象


for i in tu:
# print(i)
# <img alt="洱海清晨的彩霞倒映水中高清圖片" class="lazy" data-original="http://img95.699pic.com/photo/50061/5608.jpg_wh300.jpg" height="300" src="http://static.699pic.com/images/blank.png" title="洱海清晨的彩霞倒映水中圖片下載" width="453.30915684497"/>
print(i[‘data-original‘]) # 獲取所有的url地址

# 爬單張圖片
url = ‘http://img95.699pic.com/photo/50061/5608.jpg_wh300.jpg‘
r = requests.get(url)
f = open(‘123.jpg‘, ‘wb‘) # 以二進制寫入的方式打開一個名為123.jpg的文件 (後綴可隨意改)
f.write(r.content) # 把r傳輸的字節流寫入到文件中
f.close() # 關閉文件

技術分享圖片



# 批量寫入:

# 創建路徑, 創建一個名為“tupian”的文件夾
curpath = os.path.dirname(os.path.dirname(os.path.realpath(__file__)))
tupian = os.path.join(curpath, ‘tupian‘)
if not os.path.exists(tupian): # 判斷名字為“tupian”的文件夾是否為不存在
os.mkdir(tupian) # 不存在,則創建名字為“tupian”的文件夾
# 批量寫入圖片並保存
for i in tu:
try:
jpg_url = i[‘data-original‘] # 要獲取的圖片的地址
name = i[‘alt‘]
r = requests.get(jpg_url)
# 寫入內容,放到tupian文件夾下
f = open(os.path.join(tupian, ‘%s.jpg‘%name), ‘wb‘)
f.write(r.content)
f.close()
except:
pass

技術分享圖片

python接口自動化測試十八:使用bs4框架爬取圖片