1. 程式人生 > >python3 requests 模擬登入狀態的兩種方式

python3 requests 模擬登入狀態的兩種方式

python version: 3.6
模擬登入狀態,即有些操作是必須使用者登入後才可以進行的,技術上與cookie和session有關。
cookie是使用者登入後,伺服器返回給客戶端的,客戶端儲存cookie後,用於告訴服務端我是登入過的。
session是後端用以鑑定使用者是否處於登入狀態的一種機制(常見的是請求中加入sid,或將sid寫在cookie中)。

我遇到的情況是:
cookie的儲存可以使用登入請求的cookies方法來獲得(也是通用的)
sid是登入介面中響應的一個欄位,可以使用jsonpath解析json拿到。cookie中的內容和sid的值在後端都是儲存下來的,兩者要做匹配,匹配好了接口才可以正常訪問。

此文不是解決爬蟲登入失敗的~~只是用於工作需要

兩種方法:

1.requests的cookies方法

import requests
from jsonpath import jsonpath

login_api = 'https://xxx.xxx.com/api/user/login?sid='
login_email = '[email protected]'
login_params = {'verifyCode': 'xxxx', 'password': 'xxxxxx', 'email': login_email}

r1 = requests.post(login_api, data=login_params)
sid = jsonpath(r1.json(), '$..sid'
)[0] # print(r1.cookies) user_detail_api = 'https://xxx.xxx.com/api/user/1?sid=%s' % sid r2 = requests.get(user_detail_api, cookies=r1.cookies) # 要手動的傳下cookies print(r2.text)

好處:簡單
缺點:需要在每個需要登入狀態的介面中傳入cookies,比較麻煩

2.requests.Session()方法

import requests
from jsonpath import jsonpath

login_api = 'https://xxx.xxx.com/api/user/login?sid='
login_email = '[email protected]' login_params = {'verifyCode': 'xxxx', 'password': 'xxxxxx', 'email': login_email} s = requests.Session() r3 = s.post(login_api, data=login_params) # print(r3.cookies) # print(s.cookies) sid = jsonpath(r3.json(), '$..sid')[0] user_detail_api = 'https://xxx.xxx.com/api/user/1?sid=%s' % sid r4 = s.get(user_detail_api) # 不用傳cookies了 print(r4.text)

解釋:定義requests.Session()的一個instance,基於這個例項的請求都會使用相同的cookies
好處:可以不直接操作cookie了

參考:
1.requests官方文件:http://docs.python-requests.org/en/master/user/quickstart/
2.requests官方文件:http://docs.python-requests.org/zh_CN/latest/user/advanced.html
3.JsonPath:https://github.com/json-path/JsonPath