1. 程式人生 > >python爬取圖蟲網相簿

python爬取圖蟲網相簿

創作緣由

這幾天發現了一個很好的圖片網站,圖蟲
在這裡插入圖片描述但是裡面的圖片大部分有版權,要麼需要付費下載,要麼需要關注作者才能下載,而且在圖片上不能右擊,這讓我們下載圖片有了很大的問題,為了解決這個問題,上網搜尋了許多圖蟲網的爬蟲,發現都是千篇一律,功能都是搜尋關鍵字後下載,而且程式碼神似,估計是copy來copy去的結果,所以我想自己寫個爬蟲,只爬取制定相簿的圖片,而不需要胡亂下載一通,為了得到一條魚而幹了整條河。

如何使用

下載工程原始碼

點選下載

或者git bash;git clone [email protected]:inspurer/PythonSpider.git

下載相關依賴

在命令列下依此輸入

pip install requests   
pip install pyquery   

開啟圖蟲網

在這裡插入圖片描述
選擇你喜歡的相簿連結,比如https://tuchong.com/4293835/23849565/
複製並替換到tuchong_gallery.py程式碼裡面的gallery_url,解釋一下這個連結的作用,
前一個數字串是作者的id,後一個數字串是作者該相簿的id
注意,在開啟這個相簿時,複製地址前最好不要左右瀏覽

執行tuchong_gallery.py

你就可以看到在下載這個相簿的圖片了
相簿儲存在工程目錄下,資料夾名為作者和相簿的id
每一張圖片儲存在該資料夾下,格式為:imageid.jpg


在這裡插入圖片描述

計劃更新

增加自動搜尋

版權宣告

經本爬蟲下載後的圖片用於商用而引起的糾紛,本博主概不負責。