python爬取圖蟲網相簿
阿新 • • 發佈:2018-12-02
創作緣由
這幾天發現了一個很好的圖片網站,圖蟲
但是裡面的圖片大部分有版權,要麼需要付費下載,要麼需要關注作者才能下載,而且在圖片上不能右擊,這讓我們下載圖片有了很大的問題,為了解決這個問題,上網搜尋了許多圖蟲網的爬蟲,發現都是千篇一律,功能都是搜尋關鍵字後下載
,而且程式碼神似,估計是copy來copy去的結果,所以我想自己寫個爬蟲,只爬取制定相簿的圖片,而不需要胡亂下載一通,為了得到一條魚而幹了整條河。
如何使用
下載工程原始碼
或者git bash;git clone [email protected]:inspurer/PythonSpider.git
下載相關依賴
在命令列下依此輸入
pip install requests
pip install pyquery
開啟圖蟲網
選擇你喜歡的相簿連結,比如https://tuchong.com/4293835/23849565/
複製並替換到tuchong_gallery.py程式碼裡面的gallery_url,解釋一下這個連結的作用,
前一個數字串是作者的id,後一個數字串是作者該相簿的id
注意,在開啟這個相簿時,複製地址前最好不要左右瀏覽
執行tuchong_gallery.py
你就可以看到在下載這個相簿的圖片了
相簿儲存在工程目錄下,資料夾名為作者和相簿的id
每一張圖片儲存在該資料夾下,格式為:imageid.jpg
計劃更新
增加自動搜尋
版權宣告
經本爬蟲下載後的圖片用於商用而引起的糾紛,本博主概不負責。