Python模擬登陸新版知乎

阿新 • • 發佈：2019-02-08

目前網上很多模擬登入知乎的程式碼已經無法使用，即使是二、三月的程式碼也已經無法模擬登陸知乎，所以我現在將新版知乎的模擬登入程式碼和講解發布出來。

零、開發環境

開發工具：Pycharm
Python版本：3.6
執行環境：Win10

一、程式碼和講解

# 利用requests 模擬登陸
import requests
import http.cookiejar as cookielib
import re
import time
import hmac
from hashlib import sha1
import json
import base64
from PIL import 
 Image

# 利用session保持連結
session = requests.session()
session.cookies = cookielib.LWPCookieJar(filename="cookies.txt")  # cookie儲存檔案，
# 提取儲存的cookie
try:
    session.cookies.load(ignore_discard=True)  # 從檔案中讀取cookie
except:
    print("cookie 未能載入")

# 偽造header
agent = "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36" 

header = {
    "HOST": "www.zhihu.com",
    "Referer": "https://www.zhihu.com",
    "User-Agent": agent,
    'Connection': 'keep-alive'
}


def is_login():
    # 通過個人中心頁面返回狀態碼來判斷是否登入
    # 通過allow_redirects 設定為不獲取重定向後的頁面
    response = session.get("https://www.zhihu.com/inbox", headers=header, allow_redirects=False 
)
    if response.status_code != 200:
        zhihu_login("+8618511693445", "123*asd")
    else:
        print("你已經登陸了")


def get_xsrf_dc0():
    # 獲取xsrf code和d_c0
    # 在請求登入頁面的時候頁面會將xsrf code 和d_c0加入到cookie中返回給客戶端
    response = session.get("https://www.zhihu.com/signup", headers=header)
    return response.cookies["_xsrf"], response.cookies["d_c0"]


def get_signature(time_str):
    # 生成signature,利用hmac加密
    # 根據分析之後的js，可發現裡面有一段是進行hmac加密的
    # 分析執行加密的js 程式碼，可得出加密的欄位，利用python 進行hmac幾碼
    h = hmac.new(key='d1b964811afb40118a12068ff74a12f4'.encode('utf-8'), digestmod=sha1)
    grant_type = 'password'
    client_id = 'c3cef7c66a1843f8b3a9e6a1e3160e20'
    source = 'com.zhihu.web'
    now = time_str
    h.update((grant_type + client_id + source + now).encode('utf-8'))
    return h.hexdigest()


def get_identifying_code(headers):
    # 判斷頁面是否需要填寫驗證碼
    # 如果需要填寫則彈出驗證碼，進行手動填寫

    # 請求驗證碼的url 後的引數lang=en，意思是取得英文驗證碼
    # 原因是知乎的驗證碼分為中文和英文兩種
    # 中文驗證碼是通過選擇倒置的漢字驗證的，破解起來相對來說比較困難，
    # 英文的驗證碼則是輸入驗證碼內容即可，破解起來相對簡單，因此使用英文驗證碼
    response = session.get('https://www.zhihu.com/api/v3/oauth/captcha?lang=en', headers=headers)
    # 盤但是否存在驗證碼
    r = re.findall('"show_captcha":(\w+)', response.text)
    if r[0] == 'false':
        return ''
    else:
        response = session.put('https://www.zhihu.com/api/v3/oauth/captcha?lang=en', headers=header)
        show_captcha = json.loads(response.text)['img_base64']
        with open('captcha.jpg', 'wb') as f:
            f.write(base64.b64decode(show_captcha))
        im = Image.open('captcha.jpg')
        im.show()
        im.close()
        captcha = input('輸入驗證碼:')
        session.post('https://www.zhihu.com/api/v3/oauth/captcha?lang=en', headers=header,
                     data={"input_text": captcha})
        return captcha


def zhihu_login(account, password):
    '''知乎登陸'''
    post_url = 'https://www.zhihu.com/api/v3/oauth/sign_in'
    XXsrftoken, XUDID = get_xsrf_dc0()
    header.update({
        "authorization": "oauth c3cef7c66a1843f8b3a9e6a1e3160e20",  # 固定值
        "X-Xsrftoken": XXsrftoken,
    })
    time_str = str(int((time.time() * 1000)))
    # 直接寫在引號內的值為固定值，
    # 只要知乎不改版反爬蟲措施，這些值都不湖邊
    post_data = {
        "client_id": "c3cef7c66a1843f8b3a9e6a1e3160e20",
        "grant_type": "password",
        "timestamp": time_str,
        "source": "com.zhihu.web",
        "password": password,
        "username": account,
        "captcha": "",
        "lang": "en",
        "ref_source": "homepage",
        "utm_source": "",
        "signature": get_signature(time_str),
        'captcha': get_identifying_code(header)
    }

    response = session.post(post_url, data=post_data, headers=header, cookies=session.cookies)
    if response.status_code == 201:
        # 儲存cookie，下次直接讀取儲存的cookie，不用再次登入
        session.cookies.save()
    else:
        print("登入失敗")


if __name__ == '__main__':
    is_login()

加入QQ群，共享IT技術和資源
這裡寫圖片描述

Python模擬登陸新版知乎

目前網上很多模擬登入知乎的程式碼已經無法使用，即使是二、三月的程式碼也已經無法模擬登陸知乎，所以我現在將新版知乎的模擬登入程式碼和講解發布出來。零、開發環境開發工具：Pycharm Python版本：3.6 執行環境：Win10 一、程式碼

基於pyppeteer實現最新版知乎模擬登陸

現在還在爬知乎的同學，想必已經被知乎這個登陸搞得頭大了吧，哈哈哈哈哈！！用selenium吧，不行，會被檢測出來，用requests構造表單吧，提交的加密引數複雜，而且還不給出那些引數名，知乎的攻城獅為了反爬，很牛B好吧！！！我還試過用selenium結合mit

python爬蟲--模擬登錄知乎

print url 開發數字 pan tps 參數 content 開發者 1、處理登錄表單處理登錄表單可以分為2步：第一、查看網站登錄的表單，構建POST請求的參數字典；第二、提交POST請求。打開知乎登錄界面，https://www.zhi

模擬登錄知乎selenium在python中

sub spa down ble 版本 body IT sites from from selenium import webdriver from scrapy.selector import Selector browser = webdriver.Chrome(ex

Python 模擬登陸

python 模擬登陸import urllibimport urllib.requestimport gzipimport httpimport http.cookiejar#定義一個方法用於生成請求頭信息，處理cookie def getOpener(head): # 初始化一個CookieJar來

Android（Java）模擬登錄知乎並抓取用戶信息

成功 trac += ear 網絡請求 list i++ ger tails 前不久。看到一篇文章我用爬蟲一天時間“偷了”知乎一百萬用戶。僅僅為證明PHP是世界上最好的語言，該文章中使用的登錄方式是直接復制cookie到代碼中，這裏呢，我不以爬信息為目的

python爬蟲如何爬知乎的話題？

write targe connect 問題 brush img fetchone new text 因為要做觀點，觀點的屋子類似於知乎的話題，所以得想辦法把他給爬下來，搞了半天最終還是妥妥的搞定了，代碼是python寫的，不懂得麻煩自學哈！懂得直接看代碼，絕對可用 #c

通過抓包，實現Python模擬登陸各網站，原理分析！

瀏覽器中 cda class 登陸驗證查詢圖片自動化 cap 一、教程簡介 1.1 基本介紹通過分析登陸流程並使用 Python 實現模擬登陸到一個實驗提供的網站，在實驗過程中將學習並實踐 Python 的網絡編程，Python 實現模擬登陸的方法，使

使用selenium模擬登錄知乎

獲得 rom 教程方法 mage 解析進行第三方問題網上流傳著許多抓取知乎數據的代碼，抓取它的數據有一個問題一定繞不過去，那就是模擬登錄，今天我們就來聊聊知乎的模擬登錄。獲取知乎內容的方法有兩種，一種是使用request，想辦法攜帶cookies等必要參數去請求

python scrapy爬取知乎問題和收藏夾下所有答案的內容和圖片

上文介紹了爬取知乎問題資訊的整個過程,這裡介紹下爬取問題下所有答案的內容和圖片,大致過程相同,部分核心程式碼不同. 爬取一個問題的所有內容流程大致如下: 一個問題url 請求url,獲取問題下的答案個數(我不需要,因為之前獲取問題資訊的時候儲存了問題的回答個數) 通過答案的介面去獲取答案(如果一次獲取5

Python模擬登陸CSDN

找到CSDN登入頁，先開啟Google審查工具，鍵入錯誤使用者名稱密碼，登入CSDN，找到合適引數找到後即可設定，程式碼如下： import urllib.parse import urllib.request import http.cookiejar

我用Python爬了7W知乎使用者資訊，終於爬獲了心儀小姐姐……

馬上又要到元旦了，在舉國一片“買買買”的呼聲中，單身汪的咆哮聲也愈發淒厲了。作為一個 Python 程式設計師，要如何找到小姐姐，避開暴擊傷害，在智中取勝呢？於是就有了以下的對話： so~今天我們的目標是，爬社群的小姐姐~而且，我們又要用到新的姿勢(霧)了~scrapy

Python模擬登陸——以登陸某研究生官網為例

大家經常會用Python進行網路爬蟲，但是有些網站是需要登陸才能看到內容的，那怎麼用Python實現模擬登陸呢？主要有三種方式。方法一、直接使用已知的cookie訪問，特點：簡單，但是需要事先登陸網站，而且這個cookie具有時效性。（注意！！！）原理：cookie儲存在發起請求的客

python爬蟲——爬取知乎上自己關注的問題

與之前爬的網站圖片的不同的是，現在爬取的是要自己個人的關注的東西，所以需要做到模擬登入。模擬登入的原理是登入網站後，在瀏覽器上獲取儲存的cookies資訊，填充之後與請求一起傳送。如果前面的爬取圖片的會爬取了，對於這個解析字串的也沒有多大問題了。一直看著知乎上很多程式設計師把

用Python挖一挖知乎上宅男們最喜歡的1000個妹子

導讀：在文章開始前，先來一張圖給大家熱熱身。這裡是宅男們最喜歡的妹子中排名前200位的頭像（實際

新版知乎登入request登入（2）（類程式設計）

接上一篇，用類重構了程式碼，方法是一致的，但是看起來更整潔些。不多說了，上程式碼： #! /usr/local/bin python3.6 """ @Time : 2018/4/17 20:00 @Author : ysj @Site :

Python爬蟲爬取知乎小結

最近學習了一點網路爬蟲，並實現了使用python來爬取知乎的一些功能，這裡做一個小的總結。網路爬蟲是指通過一定的規則自動的從網上抓取一些資訊的程式或指令碼。我們知道機器學習和資料探勘等都是從大量的資料出發，找到一些有價值有規律的東西，而爬蟲則可以幫助我們解決

通過Python爬蟲爬取知乎某個問題下的圖片

該爬蟲的完整程式碼我把它放到了GitHub上，因為目前是在一點點的增加功能階段，所以程式碼可能沒有完善好，但是正常執行時沒有問題的，歡迎拍磚，:) 該爬蟲主要是通過requests來實現的，該模組完全可以很好的代替urllib和urllib2，而且功能更強大，詳細可以看這

如何用Python+人工識別處理知乎的倒立漢字驗證碼

目前知乎採用了“倒立漢字”驗證碼，如圖所示：使用者需要點選圖片中所有的倒立漢字才能登陸知乎。這給Python爬蟲的模擬登入帶來了一定的難度，目前網路上的相關資料針對的都是普通的“英文+數字”驗證碼，針對“倒立漢字”驗證碼的文章較少。而且大家普遍採用的是requ

python 爬蟲(二) 爬蟲知乎製作成電子書傳送到kindle

平時關注比較多的知乎話題，上網的狀態下看著會容易走神，所以寫了個python指令碼用來抓取自己喜歡的問題，然後推送到自己kinle看。 http://www.30daydo.com/article/7 from email.mime.text import M

Python模擬登陸新版知乎

零、開發環境

一、程式碼和講解

相關推薦