1. 程式人生 > >【暗戀不可恥但無用】QQ空間爬蟲-Python版(pyzone-crawler)

【暗戀不可恥但無用】QQ空間爬蟲-Python版(pyzone-crawler)

完整原文(含原始碼):http://exp-blog.com/2018/09/15/pid-2364/
(轉載請註明出處,僅供分享學習,嚴禁用於商業用途)


宣告

  • 在你心中是否有一個默默關注的小姐姐?
  • 你是否想知道在遇見她之前在她身邊的一切?
  • 確認過眼神,讓你總在對的時間遇上對的人

  • 寫這個外掛純粹是出於學習目的,此博文主要作用是功能展示
  • 之後會圍繞這個外掛,寫一個系列的爬蟲教程
  • 請勿使用此軟體做不可描述的事情
  • 未經允許禁止出於商用目的使用此外掛,違者列入授權黑名單並公開示眾,所帶來的一切後果自負

執行環境


軟體介紹

 此外掛主要用於QQ空間,主要功能包括:

  • 模擬QQ登陸
  • 爬取目標QQ空間的【相簿資料】,根據相簿專輯分類,自動下載高清原圖、以及圖片描述等
  • 爬取目標QQ空間的【說說資料】,根據說說頁數分類,自動下載高清原圖、以及說說內容等
  • 自動整理所下載的【相簿/說說資料】

執行介面展示

※ 登陸QQ空間
登陸QQ空間


※ 爬取QQ空間相簿
爬取QQ空間相簿


※ 爬取QQ空間說說
爬取QQ空間說說


※ 分類整理所下載的圖文資料
分類整理所下載的圖文資料


安裝與使用

  • 01. 安裝Python環境【python-3.5.2-amd64.exe
  • 02. 匯入pyzone-crawler專案原始碼並執行
  • 03. 根據命令列提示,選擇【爬取相簿資料】或【爬取說說資料】,即可自動批量下載 圖片及其相關資訊
  • 04. 所下載的資料會自動整理到程式根目錄下的 data 資料夾:
      ○ 不同的QQ空間資料,儲存在對應的 [QQ號資料夾] 內
      ○ [album] 資料夾下儲存了目標QQ的每一個相簿(非加密相簿)的 [相簿資訊]、[照片]、[照片資訊]
      ○ [mood] 資料夾下儲存了目標QQ的所有說說的 [圖文資訊]
      ○ [mood/content] 資料夾根據頁數儲存了該頁內所有說說的 [圖文資訊]
      ○ [mood/photos] 資料夾彙總了所有說說的圖片

注:
 此程式需要授權才能使用(防止惡意使用),請加QQ群209442488申請
 此程式不包含盜號後門,若不放心請勿使用
 此程式不包含破解功能,請確保登陸的QQ號有訪問對方QQ空間和相簿的許可權


升級記錄


v1.1版本 (2018-09-15) :

  • 01. 修正因QQ空間升級導致xhr協議失效問題


v1.0版本 (2018-05-26) :

  • 01. 從Java平臺移植

版權宣告

Copyright (C) 2016-2018 By EXP License: GPL v3