Python爬蟲：抓取手機APP的數據

阿新 • • 發佈：2018-05-29

sig ner ont sele ebo span fail pytho 抓取

摘要: 大多數APP裏面返回的是json格式數據，或者一堆加密過的數據。這裏以超級課程表APP為例，抓取超級課程表裏用戶發的話題。

1、抓取APP數據包

方法詳細可以參考這篇博文：http://my.oschina.net/jhao104/blog/605963

得到超級課程表登錄的地址：http://120.55.151.61/V2/StudentSkip/loginCheckV4.action

表單：技術分享圖片

表單中包括了用戶名和密碼，當然都是加密過了的，還有一個設備信息，直接post過去就是。

另外必須加header,一開始我沒有加header得到的是登錄錯誤，所以要帶上header信息。

技術分享圖片

2、登錄

登錄代碼：

#python學習交流群：125240963
import urllib2
from cookielib import CookieJar
loginUrl = ‘http://120.55.151.61/V2/StudentSkip/loginCheckV4.action‘
headers = {
    ‘Content-Type‘: ‘application/x-www-form-urlencoded; charset=UTF-8‘,
    ‘User-Agent‘: ‘Dalvik/1.6.0 (Linux; U; Android 4.1.1; M040 Build/JRO03H) 
‘,
    ‘Host‘: ‘120.55.151.61‘,
    ‘Connection‘: ‘Keep-Alive‘,
    ‘Accept-Encoding‘: ‘gzip‘,
    ‘Content-Length‘: ‘207‘,
    }
loginData = ‘phoneBrand=Meizu&platform=1&deviceCode=868033014919494&account=FCF030E1F2F6341C1C93BE5BBC422A3D&phoneVersion=16&password=A55B48BB75C79200379D82A18C5F47D6&channel=MXMarket&phoneModel=M040&versionNumber=7.2.1& 
‘
cookieJar = CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cookieJar))
req = urllib2.Request(loginUrl, loginData, headers)
loginResult = opener.open(req).read()
print loginResult

登錄成功會返回一串賬號信息的json數據

技術分享圖片

和抓包時返回數據一樣，證明登錄成功

技術分享圖片

3、抓取數據

用同樣方法得到話題的url和post參數

做法就和模擬登錄網站一樣。詳見：http://my.oschina.net/jhao104/blog/547311

下見最終代碼，有主頁獲取和下拉加載更新。可以無限加載話題內容。

#!/usr/local/bin/python2.7
# -*- coding: utf8 -*-
"""
  超級課程表話題抓取
"""
import urllib2
from cookielib import CookieJar
import json


‘‘‘ 讀Json數據 ‘‘‘
def fetch_data(json_data):
    data = json_data[‘data‘]
    timestampLong = data[‘timestampLong‘]
    messageBO = data[‘messageBOs‘]
    topicList = []
    for each in messageBO:
        topicDict = {}
        if each.get(‘content‘, False):
            topicDict[‘content‘] = each[‘content‘]
            topicDict[‘schoolName‘] = each[‘schoolName‘]
            topicDict[‘messageId‘] = each[‘messageId‘]
            topicDict[‘gender‘] = each[‘studentBO‘][‘gender‘]
            topicDict[‘time‘] = each[‘issueTime‘]
            print each[‘schoolName‘],each[‘content‘]
            topicList.append(topicDict)
    return timestampLong, topicList


‘‘‘ 加載更多 ‘‘‘
def load(timestamp, headers, url):
    headers[‘Content-Length‘] = ‘159‘
    loadData = ‘timestamp=%s&phoneBrand=Meizu&platform=1&genderType=-1&topicId=19&phoneVersion=16&selectType=3&channel=MXMarket&phoneModel=M040&versionNumber=7.2.1&‘ % timestamp
    req = urllib2.Request(url, loadData, headers)
    loadResult = opener.open(req).read()
    loginStatus = json.loads(loadResult).get(‘status‘, False)
    if loginStatus == 1:
        print ‘load successful!‘
        timestamp, topicList = fetch_data(json.loads(loadResult))
        load(timestamp, headers, url)
    else:
        print ‘load fail‘
        print loadResult
        return False

loginUrl = ‘http://120.55.151.61/V2/StudentSkip/loginCheckV4.action‘
topicUrl = ‘http://120.55.151.61/V2/Treehole/Message/getMessageByTopicIdV3.action‘
headers = {
    ‘Content-Type‘: ‘application/x-www-form-urlencoded; charset=UTF-8‘,
    ‘User-Agent‘: ‘Dalvik/1.6.0 (Linux; U; Android 4.1.1; M040 Build/JRO03H)‘,
    ‘Host‘: ‘120.55.151.61‘,
    ‘Connection‘: ‘Keep-Alive‘,
    ‘Accept-Encoding‘: ‘gzip‘,
    ‘Content-Length‘: ‘207‘,
    }

‘‘‘ ---登錄部分--- ‘‘‘
loginData = ‘phoneBrand=Meizu&platform=1&deviceCode=868033014919494&account=FCF030E1F2F6341C1C93BE5BBC422A3D&phoneVersion=16&password=A55B48BB75C79200379D82A18C5F47D6&channel=MXMarket&phoneModel=M040&versionNumber=7.2.1&‘
cookieJar = CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cookieJar))
req = urllib2.Request(loginUrl, loginData, headers)
loginResult = opener.open(req).read()
loginStatus = json.loads(loginResult).get(‘data‘, False)
if loginResult:
    print ‘login successful!‘
else:
    print ‘login fail‘
    print loginResult

‘‘‘ ---獲取話題--- ‘‘‘
topicData = ‘timestamp=0&phoneBrand=Meizu&platform=1&genderType=-1&topicId=19&phoneVersion=16&selectType=3&channel=MXMarket&phoneModel=M040&versionNumber=7.2.1&‘
headers[‘Content-Length‘] = ‘147‘
topicRequest = urllib2.Request(topicUrl, topicData, headers)
topicHtml = opener.open(topicRequest).read()
topicJson = json.loads(topicHtml)
topicStatus = topicJson.get(‘status‘, False)
print topicJson
if topicStatus == 1:
    print ‘fetch topic success!‘
    timestamp, topicList = fetch_data(topicJson)
    load(timestamp, headers, topicUrl)

結果：

技術分享圖片

python學習交流群：125240963

轉載請註明來源：http://my.oschina.net/jhao104/blog/606922

Python爬蟲：抓取手機APP的數據

sig ner ont sele ebo span fail pytho 抓取摘要: 大多數APP裏面返回的是json格式數據，或者一堆加密過的數據。這裏以超級課程表APP為例，抓取超級課程表裏用戶發的話題。 1、抓取APP數據包方法詳細可以參考這篇博文：

Python爬蟲：抓取手機APP資料

1、抓取APP資料包得到超級課程表登入的地址：http://120.55.151.61/V2/StudentSkip/loginCheckV4.action 表單：表單中包括了使用者名稱和密碼，當然都是加密過了的，還有一個裝置資訊，直接

python爬蟲：抓取頁面上的超連結

Beautiful Soup 是一個可以從HTML或XML檔案中提取資料的Python庫.它能夠通過你喜歡的轉換器實現慣用的文件導航,查詢,修改文件的方式.Beautiful Soup會幫你節省數小時甚至數天的工作時間. 頁面上的超連結在HTML中，超

Python爬蟲：抓取內涵段子1000張搞笑圖片-上篇（小爬蟲誕生篇）

出於興趣，在《幕課網：Python 開發簡單爬蟲》上學習了點兒 Python 爬蟲的入門知識，跟著視訊教程抓取了百度百科的 1000 個頁面。然後自己嘗試抓取一個國外網站的資料，但可能是由於最近召開

都說Python是無所不能的！手機APP數據就能逃出我爬蟲的魔爪嗎？

連接 4.3 ffffff usb adb 返回捕捉屏幕遺憾 1.1 下載由於是收費軟件，這裏給大家一個鏈接，自行下載，windows版本，如果是其他系統還是去官網吧。https://www.charlesproxy.com 1.4 體驗一下Charles 點一下左

python爬蟲25 | 爬取下來的數據怎麽保存？ CSV 了解一下

omd iyu dpm jpeg mkt dsa tmm bgm aso 大家好我是小帥b 是一個練習時長兩年半的練習生喜歡唱！跳！ rap！籃球！敲代碼！裝逼！

Python爬蟲入門教程 29-100 手機APP數據抓取 pyspider

.text 數字 http 默認 dex text obi database size 1. 手機APP數據----寫在前面繼續練習pyspider的使用，最近搜索了一些這個框架的一些使用技巧，發現文檔竟然挺難理解的，不過使用起來暫時沒有障礙，估摸著，要在寫個5篇左右關於

python3 爬蟲實戰：用 Appium 抓取手機 app 微信的資料

From：https://blog.csdn.net/Fan_shui/article/details/81413595 本編教程從 appium 的環境配置開始，到抓取手機 app 微信朋友圈結束。知乎：https://zhuanlan.zhihu.c

Python抓取手機APP中內容

quest 手機app 開始 clas tex json 完成 keep 抓取首先下載Wireshark和模擬器（天天模擬器，夜神模擬器），天天模擬器在自帶的應用商店裏面能夠登錄微信。然後打開Wireshark選擇一個網卡開始抓包。開始抓包後，在模擬器中要抓取的APP

新手教程：如何使用Burpsuite抓取手機APP的HTTPS資料

· 手機已經獲取root許可權· 手機已經成功安裝xposed框架· 電腦一臺2.詳細步驟2.1 在手機上面安裝xposed JustTrustMeJustTrustMe是一個去掉https證書校驗的xposed hook外掛，去掉之後就可以抓取做了證書校驗的app的資料包。JustTrustMe在githu

分享好東西：android抓包工具fiddler使用介紹抓取手機APP 中資源。

正題：這裡介紹抓包的關鍵，Fiddler ，Fiddler是一個http協議除錯代理工具，它能夠記錄並檢查所有你的電腦和網際網路之間的http通訊。我們就是用這款軟體抓取，我們手機app 訪問的資源路徑的。下面我們拿例項來演示下，

python爬蟲：爬取網站視頻

爬蟲 python python爬取百思不得姐網站視頻：http://www.budejie.com/video/新建一個py文件，代碼如下：#!/usr/bin/python # -*- coding: UTF-8 -*- import urllib,re,requests import sys

圖解Fiddler如何抓手機APP數據包

數據學習 blog tar log get 記錄自己 ges 近期公司需要按照安卓app去開發h5項目，但是後端人手緊缺，沒人整理接口文擋，就只能自己抓接口。在網上自己學習，然後整理了我所用到的，以便日後自己還要使用方便查看，在此記錄。需要的胖友們也可以查看參考學習

利用Python批量抓取京東評論數據

() 開始 book for return SQ 數據返回 python js對象京東圖書評論有非常豐富的信息，這裏面就包含了購買日期、書名、作者、好評、中評、差評等等。以購買日期為例，使用Python + Mysql的搭配進行實現，程序不大，才100行。相關的解釋我都在

微信好友大揭秘，使用Python抓取朋友圈數據，通過人臉識別全面分析好友，一起看透你的“朋友圈”

類型 get ads pid 地圖文本文 .json image pack 微信：一個提供即時通訊服務的應用程序，更是一種生活方式，超過數十億的使用者，越來越多的人選擇使用它來溝通交流。不知從何時起，我們的生活離不開微信，每天睜開眼的第一件事就是打開微信，關註著朋友圈裏

【Python】抓取淘寶數據庫月報，發送郵件，本地存檔，保存元信息

epo 平臺如果更改 config 查詢 color into all 用途定期抓取淘寶數據庫月報發送郵件，保存到本地，最好是git中發送元數據到mysql中，後期可以做成接口集成到運維平臺中，便於查詢使用方式 # 下載（必須） cd ~ &&

我的第一個python爬蟲：爬取豆瓣top250前100部電影

爬取豆瓣top250前100部電影 1 # -*-coding=UTF-8 -*- 2 3 import requests 4 from bs4 import BeautifulSoup 5 6 headers = {'User-Agent':'Moz

Fiddler抓取手機APP程式資料包--過濾多餘的Sessions

1.下載並安裝Fiddler 　　下載地址：https://www.telerik.com/download/fiddler 2.設定Fiddler可監聽遠端通訊　　前提條件：需要監聽的手機和Fiddler所在的電腦必須在同一個區域網下。　　①點選Tools ——>

python爬蟲：爬取鏈家深圳全部二手房的詳細信息

data sts rip 二手房 lse area 列表 dom bubuko 1、問題描述：爬取鏈家深圳全部二手房的詳細信息，並將爬取的數據存儲到CSV文件中 2、思路分析: (1)目標網址：https://sz.lianjia.com/ershoufang/ (2

Python爬蟲：爬取網站電影資訊

以爬取電影天堂喜劇片前5頁資訊為例，程式碼如下： 1 # coding:UTF-8 2 3 import requests 4 import re 5 6 def mov(): 7 headers={'User-Agent':'Mozilla/5.0 (Windo

Python爬蟲：抓取手機APP的數據

相關推薦