python3 urllib爬蟲，你只需要看這一篇就夠了

阿新 • • 發佈：2018-11-01

寫在最前面：以下資料均脫敏

from urllib import request
import requests
import urllib

if __name__ == "__main__":
    # 介面的url
    session_requests = requests.session()
    data = {'username': '11111111', 'password': '11111111'}
    requrl ='https://xxxxxx.com/xx/login?xxxxxxxxxxxxxxxxxxxxxxx' #登入請求url
    headers = {'User-Agent': 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:58.0) Gecko/20100101 Firefox/58.0'}
    # 傳送請求
    conn=requests.post(requrl,data,headers)
    #cookies = conn.cookies.get_dict()
    print(conn.request.headers)
    newheaders = conn.request.headers
    url = "http://xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx.htm" #請求爬蟲的url
    print(type(newheaders))
    newheaders = dict(newheaders)
    print(type(newheaders))
    del newheaders['Accept-Encoding']
    print(newheaders)
    req = request.Request(url=url,headers=newheaders)
    rsp = request.urlopen(req)
    html = rsp.read().decode("utf-8","ignore")
    print(html)

因為不把Accepe-Encoding去掉，會報錯，或者亂碼

UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte

所以轉成字典，再去掉Accepe-Encoding

下面稍微解釋一下吧，首先構造登入請求報文，包含使用者名稱，密碼，登入成功後獲取cookie，使用cookie再去訪問你要爬蟲的頁面，不然還是會被登入頁面給攔截掉

能抓到你想訪問的頁面，接下來想幹什麼都可以了

關於cookie，其實你也可以手動F12看一下，Network裡，Headers裡有一個Request Headers，其中最重要的就是你的cookie，儲存了你本次登入的所有資訊，每次重新登入都會改變

python3 urllib爬蟲，你只需要看這一篇就夠了

寫在最前面：以下資料均脫敏 from urllib import request import requests import urllib if __name__ == "__main__": # 介面的url session_requests = requests.se

弄懂 Docker 你只需要讀這一篇就夠了

Docker 1. Docker 介紹 1.1 Docker 是什麼 Docker 是一個開源的應用容器引擎，基於 Go 語言開發實現，屬於作業系統層面的虛擬化技術。 Docker 可以讓開發者打包他們的應用以及依賴包到一個輕量級、可移植的容器中，然後釋出到任何安裝有 Doc

關於AIDL使用和Binder機制詳解，你只需要看這一篇即可

本篇文章從AIDL的角度來闡述Binder機制呼叫遠端服務的內部執行原理。因此本篇文章的第一部分介紹AIDL的使用，第二部分從AIDL的使用上具體介紹Binder機制。關於Binder機制的原理，可以參考簡單理解Binder機制的原理,對其有個大概的瞭解。一、AIDL

關於反爬蟲，看這一篇就夠了

編者：本文來自攜程酒店研發部研發經理崔廣宇在第三期【攜程技術微分享】上的分享，以下為整理的內容概要。牆裂建議點選視訊回放，“現場”圍觀段子手攻城獅大崔，如何高智商&高情商地完美碾壓爬蟲。。。關注攜程技術中心微信公號ctriptech，可第一時間獲知微分享資訊~

乾貨來啦。Flask框架看這一篇就夠了,關注不迷路，Jeff帶你看原始碼。開發技術時時更新

[TOC] # 一、初識Flask ## 1.1 什麼是flask? ![img](https://img2018.cnblogs.com/blog/1825659/201910/1825659-20191009213327205-1932317939.png) Flask 本是作者 Ar

關於郵件傳送，只看這一篇就夠了！！！

# 關於郵件傳送，只看這一篇就夠了！！！ ## 郵件傳送：使用smtplib、email庫來發送郵件 ## 1.傳送郵件的步驟： ![](https://img2020.cnblogs.com/blog/2074124/202007/2074124-20200728204918420-74974604

【轉】【修真院“善良”系列之十八】WEB程序員從零開始到就業的全資料V1.0——只看這一篇就夠了！

absolute feed 自己 session rem 好的 ans 一個 css樣式這是兩年以來，修真院收集整理的學習資料順序。以CSS15個任務，JS15個任務為基礎，分別依據要完成任務的不同的技能點，我們整理出來了這麽一篇在學習的時候需要看到的資料。這是Versi

Java中的多線程你只要看這一篇就夠了

== 討論 cin 線程池。 locking nth lis dset tro 引如果對什麽是線程、什麽是進程仍存有疑惑，請先Google之，因為這兩個概念不在本文的範圍之內。用多線程只有一個目的，那就是更好的利用cpu的資源，因為所有的多線程代碼都可以用單線程來實現。

Azure IOT 設備固件更新技巧，看這一篇就夠了

trigger 物聯網平臺搭建 href ice 有效面板調用創建嫌長不看版今天為大家準備的硬菜是：在 Azure IoT 中心創建 Node.js 控制臺應用，進行端到端模擬固件更新，為基於 Intel Edison 的設備安裝新版固件的流程。通過創建模擬設備

轉:Java中的多線程你只要看這一篇就夠了

無法線程不安全 str his ace oat 情況下 containe live 如果對什麽是線程、什麽是進程仍存有疑惑，請先Google之，因為這兩個概念不在本文的範圍之內。用多線程只有一個目的，那就是更好的利用cpu的資源，因為所有的多線程代碼都可以用單線程來實現

想做好PPT折線圖，看這一篇就夠了！

12月 image 菊花 -c 強調 spa any border 線圖配圖主題無關今天鄭少跟大家聊聊折線圖的使用方法，或者你有疑問，折線圖很簡單，插入修改數據不就好了嗎？如果你要是這樣想的，恭喜你，有可能你會做出下面這樣的效果。如果你要是稍微懂一點折線圖的使用方法，你就

Java中的多執行緒你只要看這一篇就夠了（轉）

引如果對什麼是執行緒、什麼是程序仍存有疑惑，請先Google之，因為這兩個概念不在本文的範圍之內。用多執行緒只有一個目的，那就是更好的利用cpu的資源，因為所有的多執行緒程式碼都可以用單執行緒來實現。說這個話其實只有一半對，因為反應“多角色”的程式程式碼，最起碼每個角色要給他一個執行緒吧，否

Linux 問題故障定位，看這一篇就夠了

1. 背景有時候會遇到一些疑難雜症，並且監控外掛並不能一眼立馬發現問題的根源。這時候就需要登入伺服器進一步深入分析問題的根源。那麼分析問題需要有一定的技術經驗積累，並且有些問題涉及到的領域非常廣，才能定位到問題。所以，分析問題和踩坑是非常鍛鍊一個人的成長和提升自我能力。如果我們有一套好的分析工具，那將是事

C語言從入門到精通，看這一篇就夠了

影響內容當前位置 replace 雙精度下標寄存器變量一個 No.1 計算機與程序設計語言的關系計算機系統由硬件系統和軟件系統構成，硬件相當於人類的肉體，而軟件相當於人類的靈魂，如果脫離了靈魂，人類就是一具行屍走肉 No.2 C語言的特點代碼簡潔，靈活性高

【MYSQL學習筆記02】MySQL的高階應用之Explain（完美詳細版，看這一篇就夠了）

版權宣告：本文為博主原創文章，未經博主允許不得轉載。 https://blog.csdn.net/wx1528159409 最近學習MySQL的高階應用Explain，寫一篇學習心得與總結，目錄腦圖如下：一、Explain基本概念 1. Explain定義 · 我們知道M

學爬蟲利器XPath,看這一篇就夠了

XPath的使用 XPath，全稱 XML Path Language，即 XML 路徑語言，它是一門在XML文件中查詢資訊的語言。XPath 最初設計是用來搜尋XML文件的，但是它同樣適用於 HTML 文件的搜尋。所以在做爬蟲時，我們完全可以使用 XPath 來做相應的資訊抽取，本節我們

Java反射機制你只要看這一篇就夠了

今天來總結一下Java反射機制，在此之前，回顧下java程式的編譯執行過程，分為三個階段：原始碼（.java檔案）進過編譯生成位元組碼檔案（.class檔案），然後jvm載入位元組碼檔案執行程式（runtime）。前兩個步驟（編譯階段）是在硬碟上完成的，後一個步驟（執行階段）是在記憶體中完成的

抖音內容運營全解剖，看這一篇就夠了 !

抖音的火爆已經不用多說，作為短視訊的頭部APP，抖音已經從微信手中奪走不少使用者時間，成為新的“時間黑洞”。比如：“中毒了，我每天晚上要刷2個小時”，“下一站，逃離微信，上抖音”… 一個企業運營抖音的目的是什麼？答案顯而易見，無非就是做品牌營銷、擴大品牌影響力。在短視訊領域積累

百萬併發下的Nginx優化，看這一篇就夠了！

本文作者主要分享在 Nginx 效能方面的實踐經驗，希望能給大家帶來一些系統化思考，幫助大家更有效地去做 Nginx。優化方法論我重點分享如下兩個問題：保持併發連線數，怎麼樣做到記憶體有效使用。在高併發的同時保持高吞吐量的重要要點。實現層面主要是三方面優化，主要聚焦

Java中的多執行緒你只要看這一篇就夠了

/** * 生產者生產出來的產品交給店員 */ public synchronized void produce() { if(this.product >= MAX_PRODUCT) { try {

python3 urllib爬蟲，你只需要看這一篇就夠了

相關推薦