爬取pexels女性圖片+百度人臉檢測過濾高顏值美女

阿新 • • 發佈：2019-01-08

pexels網站提供了大量貼圖，從中搜索美女圖片，編寫爬蟲進行下載，下載後圖片中除了女人外，還包含男人，風景、靜物和動物，呼叫百度人臉檢測模組識別檢測，將其中顏值大於60分的美女儲存到另外一個資料夾。爬取圖片共計1251張，最後過濾出的美女共計287張。上程式碼：

爬蟲程式：

from bs4 import BeautifulSoup
import requests
import os
import time
save_path = 'F://photos/'
url_path = 'https://www.pexels.com/search/'
headers ={
    'accept':'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8',
    'user-agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.112 Safari/537.36'
}
searchWord = 'beauty'
urls = [url_path+searchWord+'/?page={}'.format(str(i)) for i in range(1,100)]

if not os.path.exists(save_path):
    os.mkdir(save_path)
page =1
for url in urls:
    img_list = []
    wb_data = requests.get(url,headers=headers)
    print("當前爬取頁面連結",url)
    soup = BeautifulSoup(wb_data.text,'lxml')
    imgs = soup.select('article > a > img')
    for img in imgs:
        photo_src = img.get('src')
        img_list.append(photo_src)
    print("第{}頁，共計{}張圖片".format(page,len(img_list)))
    for item in img_list:
        data = requests.get(item, headers=headers)
        fp = open(save_path+item.split('?')[0][-10:],'wb')
        fp.write(data.content)
        fp.close()
    page = page+1
    time.sleep(2)

顏值檢測程式：

from aip import AipFace
import base64
import os
import time
import shutil
#接入百度AI人臉識別的引數
APP_ID="換成你自己的"
API_KEY = "換成你自己的"
SECRET_KEY = "換成你自己的"
imageType = "BASE64"
options = {}
options["face_field"] = "gender,beauty"
options["face_type"] = "LIVE"

#下載圖片和篩選圖片的資料夾
file_path = 'F://photos/'
copy_file_path = 'F://highScore/'
file_lists=os.listdir(file_path)

aipFace =AipFace(APP_ID,API_KEY,SECRET_KEY)
#將圖片轉換為BASE64格式，這是百度平臺的要求
def get_file_content(filePath):
    with open(filePath,'rb') as fp:
        content = base64.b64encode(fp.read())
        return content.decode('utf-8')

for file_list in file_lists:
    result = aipFace.detect(get_file_content(os.path.join(file_path,file_list)),imageType,options)
    error_code = result['error_code']
    if error_code == 222202:
        #沒有人臉
        continue
    if error_code==223110:
        #人臉太多
        continue
    try:
        sex_type = result['result']['face_list'][-1]['gender']['type']
        #只要美女圖片
        if sex_type == 'male':
            continue
        beauty = result['result']['face_list'][-1]['beauty']
        new_beauty = round(beauty/10,1)
        print(file_list,new_beauty)
        if new_beauty>=6:
            copy_src = os.path.join(file_path,str(new_beauty)+'_'+file_list)
            copy_dst = os.path.join(copy_file_path,str(new_beauty)+'_'+file_list)
            #重新命名高分照片
            os.rename(os.path.join(file_path,file_list),copy_src)
            #複製高分照片到另外的照片
            shutil.copyfile(copy_src,copy_dst)
        time.sleep(1)
    except KeyError:
        pass
    except TypeError:
        pass

爬取的圖片：

過濾後的圖片：

看看最高顏值的美女：

較低顏值的女性：

爬取pexels女性圖片+百度人臉檢測過濾高顏值美女

python 爬取動態網頁（百度圖片）

# python 3.6.3 import re import os from urllib import parse from urllib import request ################################################### # 搜尋關鍵字

python3 requets+re 批量爬取千千(原百度)音樂

以前實驗室同學需要文章和音樂，需要用爬蟲爬.....要做東西參加比賽，表示好久都沒寫爬蟲了....正如今天的正題，批量爬取千千音樂（原百度音樂）...博主會寫下爬取的過程和心得（採坑記錄），批量下載的音樂的有效程式碼雖然才50多行，但是採坑會花費大量時間和精力... 老規矩

百度人臉檢測識別 python3.5 APIV3版本

第一次寫部落格，我自己就想試試百度的人臉識別，程式碼也沒有優化，簡單的實現了一下供大家參考。實現的功能，一個資料夾有6個人的正臉照片，假設是上傳的人臉庫。另一個資料夾有100張圖片，就是抓拍的這6個人的圖片，有的圖片只有一個人，有的圖片有多個人。實現的功能

呼叫百度人臉檢測API實現簡單的顏值檢測

通過百度人工智慧平臺中的人臉檢測模組，實現簡單的人臉檢測，百度人工智慧平臺免費註冊，人臉檢測模組免費使用。相關API文件在：http://ai.baidu.com/docs#/Face-Detect-V3/top，依照API文件就可以寫出一個簡單的檢測工具。程式碼如下

爬取nyist-6000張證件照進行微軟小冰顏值分析

Python爬取nyist-6000張證件照進行顏值分析前言前幾天學校要求更新檔案資料庫的照片，所以要求每個人去照證件照，大多數人是在學校裡面的一個照相的地方照的，為了容易使同學們拿到照片，他們會每天把每個人的證件照上傳到一個網站，於是我

Python3使用百度人臉識別接口識別高顏值妹子圖片

並不是理解 exp content 平時百度 CA blank 參考一、在百度雲平臺創建應用為什麽要到百度雲平臺創建應用，首先來說是為了獲取獲取access_token時需要的API Key和Secret Key 至於為什麽需要API Key和Secret Key

[Python爬蟲]爬蟲例項:爬取PEXELS圖片---解決非同步載入問題

第一次嘗試爬取—>[Python爬蟲]爬蟲例項:三種方式爬取PEXELS圖片在爬取PEXELS時,遇到了這樣問題: 頁面使用Ajax的非同步載入技術來實現分頁,所以通過request.text無法獲取動態載入的內容.而如果想正確獲取這些資料,則需要使用名為逆向工程的過程(“抓包”

[Python爬蟲]爬蟲例項:三種方式爬取PEXELS圖片

PEXELS:Best free stock photos in one place. Pexels是一個提供免費高品質圖片,並且可商用的圖片網站.但是因為網站時外國的,所以連線和下載速度都略慢… 這裡只是為了講解圖片爬取和下載儲存的流程. 三種方式是指:分別指使用Lxml,Be

[Python爬蟲]爬蟲例項:爬取PEXELS圖片---修改為多程序爬蟲

第二次修改的地址---->爬蟲例項:爬取PEXELS圖片—解決非同步載入問題在前面的修改中,我們通過使用逆向工程成功解決了非同步載入的問題.但同時還有一個問題:效率問題,受限於網速,假如使用單程序下載圖片時下載的速度沒有佔滿,而使用多個程序時下載速度能夠佔滿的話,那麼多程序爬蟲在

Python爬蟲入門-python之爬取pexels高清圖片

先上張圖片：首先開啟網址：,然後下來會發現下面的圖片是慢慢的加載出來的，也就是通過Ajax請求得到的。在搜尋框中輸入關鍵字：beauty,開啟F12，重新整理，選中XHR,然後一直下拉下拉: 會發現左側中的URL只有一個page是在發生變化的，在通

用接口爬取今日頭條圖片

b+ req ace nco ext odin api data utf #encoding:utf8import requestsimport jsonimport redemo = requests.get(‘http://www.toutiao.com/api/pc/

利用python爬取點小圖片，滿足私欲(爬蟲)

.text write ret append jpg use download div pat import requestsimport reimport os,syslinks=[]titles=[] headers = { "User-Agent": "Mozi

百度人臉識別AI實踐.doc

compare 技術開發描述 ear 註冊 aid con square 0，前言百度開放了很多AI能力，其中人臉識別就是其中之一。本文對百度人臉識別AI進行實踐檢驗，看看其使用效果如何。鑒於是最為基礎的實踐，基本都是在其接口範例代碼修改而來。百度人臉

python爬取微博圖片數據存到Mysql中遇到的各種坑python Mysql存儲圖片

字符轉義 process 程序 zha 有一個 utf-8 get ctime python3 本人長期出售超大量微博數據，並提供特定微博數據打包，Message to [email protected] 前言由於硬件等各種原因需要把大概

知乎內容抓取二（內含百度知道、百度熱點和代理ip抓取）

sts 精華可用其他添加 get word 登錄 rar 代碼路徑：https://github.com/prophetss/zhihu-crawl 　　接上一篇，知乎的抓取主要是獲取所有話題id進而可以得到所有話題url地址然後就可以抓取具體內容了。之前通過根話

python 與百度人臉識別api

ace tps get 格式 {} 之前 _id urllib 檢測用python來做人臉識別代碼量少思路清晰，在使用之前我們需要在我們的配置的編譯器中通過pip install baidu-aip 即可 from aip import AipFace

爬蟲簡易入門程式碼-爬取簡單網頁圖片

# -*- coding: utf-8 -*- """ Created on Mon Jul 9 22:12:07 2018 @author: name """ #!/usr/bin/env Python3 # -*- encodin

python+scrapy爬取鬥魚圖片

建立scrapy的專案請參考：https://blog.csdn.net/qq_35723619/article/details/83614670 items的實現： DouyumeinvSpider建立：這次我們爬去的是json資料包：我們可以通過network監控：

python+selenium爬取動漫圖片

#在風之動漫網上下載海賊王，輸入需要下載的章節，將漫畫下載的本地#實現思路：# 1 海賊王的漫畫目錄連結是：https://www.fzdm.com/manhua/02/# 2 第X話的漫畫。連線是https://www.fzdm.com/manhua/02/X/，例如，924話連結是https://www.

爬取pexels女性圖片+百度人臉檢測過濾高顏值美女

相關推薦