python網路程式設計requests和selenium模組

阿新 • • 發佈：2018-12-23

import requests #需要命令列下pip install requests安裝
req = requests.get("http://httpbin.org/get", headers = {"User-Agent" : "ua"}, proxies = {"http" : "ip:port"}, timeout = 10, verify = False)
#以get方式開啟連結 設定User-Agent為"ua" 設定代理伺服器為"ip:port" 連線超時時間10秒 verify = False不檢測證書
print req.status_code  #返回狀態
print req. 
url          #返回請求url
print req.headers      #返回http頭
print req.cookies      #返回cookie資訊
print req.text         #返回文字形式網頁原始碼
print req.content      #返回位元組流形式網頁原始碼

requests模組的使用

from selenium import webdriver                                      #匯入selenium的瀏覽器驅動介面
chrome_options = webdriver.chrome. 
options.Options()
chrome_options.add_argument('--headless')                           #後臺模式
prefs = {"profile.managed_default_content_settings.images" : 2}
chrome_options.add_experimental_option("prefs",prefs)               #不載入圖片
chrome_options.add_argument("user-agent=" + "ua")                   #設定userAgent為"ua" 

chrome_options.add_argument("--proxy-server=http://ip:port")        #設定代理為"ip:port"
driver = webdriver.Chrome(chrome_options=chrome_options)            #根據option獲得一個瀏覽器
driver.set_page_load_timeout(90)                                    #設定頁面載入超時時間90秒
driver.get(u"https://www.baidu.com")                                #開啟一個連結
driver.save_screenshot("baidu.png")                                 #得到當前網頁的截圖
print driver.title                                                  #得到當前網頁的標題
print driver.current_url                                            #得到當前網頁的url
print driver.page_source                                            #得到當前網頁的原始碼
driver.find_element_by_id("kw").send_keys("hello world")            #得到原始碼中id為kw的物件(搜尋框) 模擬輸入文字"hello world"
driver.find_element_by_id("su").click()                             #得到原始碼中id為su的物件(搜尋按鈕) 模擬單擊
driver.execute_script("window.scrollBy(0, 3000)")                   #執行一個js指令碼 下翻頁
driver.back()                                                       #瀏覽器後退一個頁面
driver.quit()                                                       #關閉瀏覽器

使用selenium模組+chromedriver模擬瀏覽器訪問

import chardet
print chardet.detect(str) #當編碼為Unicode時報錯
#TypeError: Expected object of type bytes or bytearray, got: <type 'unicode'>

識別一個字串的編碼型別

import warnings
warnings.filterwarnings("ignore") #忽略警告資訊

忽略其它模組警告資訊

# -*- coding: utf-8 -*-
import codecs
fp = file("a.txt", "r") #utf8帶BOM檔案
str = fp.read()
fp.close()
print str
print str.replace(codecs.BOM_UTF8, "") #消除檔案UTF8格式的BOM頭

消除檔案UTF8格式的BOM頭

# -*- coding: utf-8 -*-
import HTMLParser
Parser = HTMLParser.HTMLParser() #解碼器
source = "&amp;&gt;"
source = Parser.unescape(source) #html轉移符解碼
print source

HTMLParser模組進行html轉移符解碼

import urllib
def urlEncode(str): #url編碼
    return urllib.urlencode({ "" : str })[1:]
word = "[email protected]#$%^&*()_+-= "
word = urlEncode(word)
print word

python2 urllib模組url編碼

python網路程式設計requests和selenium模組

import requests #需要命令列下pip install requests安裝 req = requests.get("http://httpbin.org/get", headers = {"User-Agent" : "ua"}, proxies = {"http" : "i

python網路程式設計 socketserver和ftp

socketserver 是 python 中提供的一個可以用於面向物件服務端開發的一個高階模組，封裝了底層 socket 的大量操作實現，通過提供面向物件的操作方式簡化程式開發。 TCP程式設計：伺服器端 # 匯入依賴的模組 import socketse

python網路程式設計--socketserver 和 ftp功能簡單說明

1. socketserver 我們之前寫的tcp協議的socket是不是一次只能和一個客戶端通訊，如果用socketserver可以實現和多個客戶端通訊。它是在socket的基礎上進行了一層封裝，也就是說底層還是呼叫的socket，在py2.7裡面叫做SocketServer也就是大寫了兩個S，

Python網路程式設計：E-mail服務(五)深入理解email模組的message和MIME類

簡介本文主要介紹Python標準庫email的message和MIME類，並分析了相關的實現，能夠是讀者更好的使用email模組。核心類Message Message類是email的核心類，它是email物件模型中基類，提供了設定和查詢郵件頭部，訪問訊息體的核心方法。從

python網路程式設計3-socketserver模組

一、複習 # 解決黏包問題 #為什麼會出現黏包問題 # 首先只有在TCP協議中才會出現黏包現象 # 是因為TCP協議是面向流的協議 # 在傳送的資料傳輸過程中有快取機制來避免資料丟失 # 因此在連續傳送小資料的時候，以及接收大小不符的時候都容易出現尿包現象

Python學習：網路程式設計'TCP'和'UDP'

網路程式設計：計算機之間做資料交換客戶端：前端服務端：如何將資料傳送到服務端服務端資料如何下發給客戶端網路程式設計三要素： ip地址：計算機在網路上的位置埠號：應用程式協議：傳輸的方式，對話方式 TCP:需要建立連線，速度慢，可靠安全{打電話}

Python網路程式設計之socket模組基礎例項

[linux 公社]https://www.linuxidc.com/Linux/2018-12/155920.htm 1、引言本文呢主要對Python網路程式設計中用到的socket模組進行初步總結。首先從網路基礎理論出發，介紹了TCP協議和UDP協議；然後總結了sock

Python網路程式設計之socket模組基礎例項！

TCP是流協議，而UDP是資料報協議。換句話說，TCP在客戶機和伺服器之間建立持續的開放連線，在該連線的生命期內，位元組可以通過該連線寫出（並且保證順序正確）。然而，通過 TCP 寫出的位元組沒有內建的結構，所以需要高層協議在被傳輸的位元組流內部分隔資料記錄和欄位。 UD

Python網路程式設計socket模組例項解析

socket通常也稱作”套接字”，用於描述IP地址和埠，是一個通訊鏈的控制代碼，應用程式通常通過”套接字”向網路發出請求或者應答網路請求。 socket起源於Unix，而Unix/Linux基本哲學之一就是“一切皆檔案”，對於檔案用【開啟】【讀寫】【關閉】模式來操作。socket就是該模式的一個實現，soc

Python網路程式設計：E-mail服務(八) 實現抄送和密送功能

簡介本文介紹如何通過smtp模組實現郵件的抄送和密送功能。抄送功能實現在傳送郵件時，除了傳送給相關的責任人，有時還需要知會某些人。這時就需要在郵件裡指定抄送人員列表。相關實現如下： import

python網路程式設計--程序的方法和通訊,鎖, 佇列,生產者消費者模型

1.程序的其他方法　　程序:正在進行的一個過程或者說一個任務.負責執行任務的是cpu,程序之間的空間是相互隔離的　　使用multiprocess模組來開啟程序 Process([group [, target[, name [, args [,kwargs]]]]])由該類例項化的物件,可用來開啟

Python網路程式設計之socketserver模組實現併發

為什麼要講socketserver？我們之前寫的tcp協議的socket是不是一次只能和一個客戶端通訊，如果用socketserver可以實現和多個客戶端通訊。它是在socket的基礎上進行了一層封裝，也就是說底層還是呼叫的socket，在py2.7裡面叫做SocketServer也就是大寫了兩個S，在py3

Python網路程式設計 ---Socket模組學習之獲取遠端裝置IP（二）

1、使用內建庫函式gethostbyname()，引數為遠端裝置的主機名。新建檔案 getremotemachineinfo.py#!/usr/bin/python import socket def get_remote_machine_info(): remote

淺析Python中的struct模組(python網路程式設計)

最近在學習python網路程式設計這一塊，在寫簡單的socket通訊程式碼時，遇到了struct這個模組的使用，當時不太清楚這到底有和作用，後來查閱了相關資料大概瞭解了，在這裡做一下簡單的總結。瞭解c語言的人，一定會知道struct結構體在c語

python網路程式設計之互斥鎖

標籤（空格分隔）：互斥鎖程序之間的資料不共享，但是共享同一套檔案系統，所以訪問同一個檔案，或者同一個列印終端，是沒有問題的，而共享帶來的問題就是競爭，競爭帶來的結果就是錯亂，如下： #併發執行,效率高,但競爭同一列印終端,帶來了列印錯亂 from multiprocessing import Pr

python網路程式設計之setsockopt

1、TCP連線的建立方法客戶端在建立一個TCP連線時一般需要兩步，而伺服器的這個過程需要四步，具體見下面的比較。步驟 TCP客戶端 TCP伺服器第一步建立socket物件

python網路程式設計整理

1、C/S、B/S架構 client<------>server browser<------>server 學習socket程式設計就是要編寫一個客戶端軟體和服務端軟體然後實現服務端與客戶端基於網路通訊2、什麼是網路？ 1、物理連線介質 2、網際

小飛俠帶你精通Python網路程式設計系列03-Python版本的選擇

1. 目前Python有兩個主要版本Python2.X和Python3.X 2. Python2.X最後一個版本是2.7，目前（2018年10月21日）Python3.X最新版本為3.7 3. 很不幸，Python3不完全相容Python2，事實上Python3 在2008年就釋出了，而最後一個Pytho

python 網路程式設計粘包解決方案2 + ftp上傳 + socketserver

一。struct 神奇的打包工具 struct 程式碼: import struct num = 156 #將int型別的資料打包成4個位元組的資料 num_stru = struct.pack('i',num) print(len(num_stru)) print

Python網路程式設計攻略(2-2)

用select.select編寫一個聊天伺服器程式碼如下： #coding: utf-8 import select import socket import sys import signal import cPickle import struct import argparse SER

python網路程式設計requests和selenium模組

相關推薦