Python爬蟲之模擬登陸知乎

阿新 • • 發佈：2019-02-10

在chrome瀏覽器下抓取登陸過程的包（注意把Preserve log勾上）：

表單的結構主要包括_xsrf, password, phone_num

我們要找到_xsrf的值，重新載入zhihu.com之後我們可以發現Response裡面有_xsrf

我們就可以把_xsrf的值讀取出來

然後set一下cookies，就可以模擬登陸知乎了。

import requests
from bs4 import BeautifulSoup

zhihu_url = 'http://www.zhihu.com'
headers = {
        'Referer': 'http://www.zhihu.com/',
        'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Ubuntu Chromium/55.0.2883.87 Chrome/55.0.2883.87 Safari/537.36'}
#get xsrf
xsrf = BeautifulSoup(requests.get(zhihu_url, headers = headers).content, 'html.parser').find('input')['value']

#get cookies
data = {
        '_xsrf': xsrf,
        'phone_num': '***********',
        'password': '**********'}

loginurl = 'https://www.zhihu.com/login/phone_num'
cookies = requests.post(loginurl, data = data, headers = headers).cookies

#login
url = 'https://www.zhihu.com/question/55940910'
html = requests.get(url, headers = headers, cookies = cookies)
soup = BeautifulSoup(html.content, 'html.parser')
titles = soup.select(r'.QuestionHeader-title')
print('title: ', titles[0].text)

Python爬蟲之模擬登陸知乎

在chrome瀏覽器下抓取登陸過程的包（注意把Preserve log勾上）：表單的結構主要包括_xsrf, password, phone_num 我們要找到_xsrf的值，重新載入zhihu.

python--python3爬蟲之模擬登入知乎

程式碼在python3環境下測試通過： from bs4 import BeautifulSoup import requests url = 'http://www.zhihu.com' login_url = url+'/login/email' captcha_

python 爬蟲之模擬登陸

import requests def run(): url = "http://jira.1handcar.com:14001/secure/BrowseProjects.jspa" headers = {'Host':'jira.1handcar.com:14001'

Python爬蟲之爬取知乎帖子並儲存到mysql（以及遇到問題和解決方法）

爬取問題標題並儲存到資料庫：程式碼： # coding=utf-8 import urllib import urllib2 import re import MySQLdb #co

利用python requests庫模擬登陸知乎

當初搜模擬登陸的時候在知乎上也找到一些內容。以下是程式碼 import requests import time import json import os import re import sys import subprocess from bs4 import Be

python爬蟲模擬登陸知乎網

自從暑假學了大概一個月左右的爬蟲，開學之後就沒怎麼搞爬蟲了，當時也就學到scrapy框架就放下了，大致瞭解了一下框架，不是太理解，但是在這之前本人的爬蟲水平也僅僅侷限於爬取簡單頁面，爬取動態頁面也稍微瞭解下，但是一直沒有學模擬登陸，因為當時怎麼也搞不懂模擬登陸是

python爬蟲6——模擬登陸人人網

用python怎麼自動登入一個網站呢？之前我也有過這樣的疑問，老自己去填，多麻煩啊，接下來這篇文章將講解怎麼用python2模擬登陸人人網。一、用fiddler檢視登入資訊模擬登陸第一步，用fiddler檢視發出訪問資訊的請求：網頁：輸入多次後，會要求輸入驗證碼：

Python3爬蟲之模擬登陸

爬取一些不需要登陸的網址操作已經試過了，這次來用Python嘗試需要登陸的網址，來利用cookie模擬登陸我用的是火狐瀏覽器自帶的F12開發者工具，開啟網址輸入賬號，密碼，登陸，如圖可以看到捕捉到很多post和get請求，第一個post請求就是我們提交賬號和密

Python爬蟲之模擬登入豆瓣獲取最近看過的電影

哈哈哈，模擬登入成功啦啦啦啦啦~~~~~ 重要的事本來要說三遍，不過還是算了== 先上效果圖：眾所周知，很多網站都設定了登入之後才能獲取檢視頁面的權利，因此模擬登入成了爬取資訊的第一步，這一步

Scrapy 模擬登陸知乎--抓取熱點話題

折騰了將近兩天，中間數次想要放棄，還好硬著頭皮搞下去了，在此分享出來，希望有同等需求的各位能少走一些彎路。原始碼放在了github上，歡迎前往檢視。若是幫你解決了問題，或者給了你啟發，不要吝嗇給加一星。工具準備在開始之前，請確保 scrpay 正確安裝，手頭有一款簡潔

轉載-Python爬蟲之模擬登入總結

備註：python 2.7.9，32位有些網站需要登入後才能爬取所需要的資訊，此時可以設計爬蟲進行模擬登入，原理是利用瀏覽器cookie。一、瀏覽器訪問伺服器的過程：（1）瀏覽器（客戶端）向Web伺服器發出一個HTTP請求（Http r

使用OKHttp模擬登陸知乎，兼談OKHttp中Cookie的使用！

本文主要是想和大家探討技術，讓大家學會Cookie的使用，切勿做違法之事！很多Android初學者在剛開始學習的時候，或多或少都想自己搞個應用出來，把自己學的十八般武藝全都用在這個APP上，其實這個想法很好，專案驅動學習，效率更高，這是大學老師教給我的。可是一個APP，如果純

python爬蟲(一):模擬登陸微博

最近花了不少時間來學python爬蟲，覺得還是有很多問題的，比如說requests.get獲得Pixiv的網頁原始碼，一直獲取不到，不過我猜測大概是headers的問題，準備之後處理。廢話少說我們先來講一講模擬登陸微博的問題。第一步:用Chrome來抓包

模擬登陸知乎，2016/10/23可用

登入這東西，目前理解的還是比較淺，就是說想辦法搞到cookie就好。最簡單就是自己用瀏覽器登入上，從開發者工具裡把cookie複製。。。今天說的呢，既然是模擬登陸，就少不了賬號密碼這些環節。首先開啟知乎https://www.zhihu.com/#signin，開發者工

【scrapy】模擬登陸知乎

這個網上有個通用的教程，然而為這個教程已經花費了太多時間進行除錯，和知乎上的朋友交流，很多人也是這個地方遇到了問題，最後的結果。。是放棄了crawlspider。。先貼下這個連結。。。http://ju.outofmemory.cn/entry/105646 謹慎。。

用selenium模擬登陸知乎賬號，處理登陸介面隨機出現驗證碼視窗的問題

import requests from selenium import webdriver from bs4 import BeautifulSoup import time while True: #option = webdriver.Chr

Python爬蟲新手教程：知乎文章圖片爬取器

1. 知乎文章圖片爬取器之二部落格背景昨天寫了知乎文章圖片爬取器的一部分程式碼，針對知乎問題的答案json進行了資料抓取，部落格

Python爬蟲學習筆記之模擬登陸並爬去GitHub

過程 eight res 開發者工具 @value clas 之前自己 8.0 (1)環境準備: 請確保已經安裝了requests和lxml庫 (2)分析登陸過程: 首先要分析登陸的過程，需要探究後臺的登陸請求是怎樣發送的，登陸之後又有怎樣的

知乎爬蟲之模擬登入

爬蟲簡單的原理就是傳送一個請求到網站的伺服器，伺服器進行響應，然後從伺服器響應的內容解析出我們想要的資料這裡我們將用requests庫來發送請求（Windows上面在控制檯通過pip3 install requests 進行安裝），解析可以用beauti

Python爬蟲之模擬登陸知乎

相關推薦