Python學習筆記22（urllib模塊）

阿新 • • 發佈：2017-11-20

ror 轉換 decode urllib模塊 one 處理 context hello mpat

Python3和Python2的urllib模塊不太一樣，本篇文章是以Python3為前提。

1.urlopen的使用

import urllib.request

urllib.request.urlopen(url, data=None, [timeout, ]*, cafile=None, capath=None, cadefault=False, context=None)

#url：需要抓取的網頁
#data：Post提交的數據。默認為空，使用的是get請求，若data有數據則是Post請求
#timeout：設置網站的訪問超時時間

import urllib.request

response  
= urllib.request.urlopen(‘http://www.baidu.com‘)
print(response.read().decode(‘utf-8‘))

#response.read() 獲取的數據格式為bytes類型
#需要decode（），轉換成str類型

#POST請求

import urllib.parse
import urllib.request

data = bytes(urllib.parse.urlencode({‘word‘: ‘hello‘}), encoding=‘utf8‘)
response = urllib.request.urlopen(‘ 
http://httpbin.org/post‘, data=data)
print(response.read())

#超時設置
import urllib.request

response = urllib.request.urlopen(‘http://httpbin.org/get‘, timeout=0.1)
print(response.read())

2.Request的使用

#get請求
import urllib.request

request = urllib.request.Request(‘https://python.org‘)
response = urllib.request.urlopen(request)
 
print(response.read().decode(‘utf-8‘))

#post請求
from urllib import request, parse

url = ‘http://httpbin.org/post‘
headers = {
    ‘User-Agent‘: ‘Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)‘,
    ‘Host‘: ‘httpbin.org‘
}
dict = {
    ‘name‘: ‘Germey‘
}
data = bytes(parse.urlencode(dict), encoding=‘utf8‘)
req = request.Request(url=url, data=data, headers=headers, method=‘POST‘)
response = request.urlopen(req)
print(response.read().decode(‘utf-8‘))

3.代理

import urllib.request

proxy_handler = urllib.request.ProxyHandler({
    ‘http‘: ‘http://127.0.0.1:9743‘,
    ‘https‘: ‘https://127.0.0.1:9743‘
})
opener = urllib.request.build_opener(proxy_handler)
response = opener.open(‘http://httpbin.org/get‘)
print(response.read().decode(‘utf-8‘))

4.Cookie

#獲取cookie
import http.cookiejar, urllib.request

cookie = http.cookiejar.CookieJar()
handler = urllib.request.HTTPCookieProcessor(cookie)
opener = urllib.request.build_opener(handler)
response = opener.open(‘http://www.baidu.com‘)
for item in cookie:
    print(item.name+"="+item.value)

#獲取cookie並且保存在文件中
#有兩種格式，記得哪種格式存的哪種格式讀就好
#格式一
import http.cookiejar, urllib.request
filename = "cookie.txt"
cookie = http.cookiejar.MozillaCookieJar(filename)
handler = urllib.request.HTTPCookieProcessor(cookie)
opener = urllib.request.build_opener(handler)
response = opener.open(‘http://www.baidu.com‘)
cookie.save(ignore_discard=True, ignore_expires=True)
#格式二
import http.cookiejar, urllib.request
filename = ‘cookie.txt‘
cookie = http.cookiejar.LWPCookieJar(filename)
handler = urllib.request.HTTPCookieProcessor(cookie)
opener = urllib.request.build_opener(handler)
response = opener.open(‘http://www.baidu.com‘)
cookie.save(ignore_discard=True, ignore_expires=True)


#以格式二讀cookie，並且訪問url
import http.cookiejar, urllib.request
cookie = http.cookiejar.LWPCookieJar()
cookie.load(‘cookie.txt‘, ignore_discard=True, ignore_expires=True)
handler = urllib.request.HTTPCookieProcessor(cookie)
opener = urllib.request.build_opener(handler)
response = opener.open(‘http://www.baidu.com‘)
print(response.read().decode(‘utf-8‘))

5.異常處理

#urllib.error有兩個錯誤類URLError和HTTPError，HTTPError是URLError的子類，所以一般先捕捉小的錯誤類，再捕捉大的錯誤類

from urllib import request, error

try:
    response = request.urlopen(‘http://cuiqingcai.com/index.htm‘)
except error.HTTPError as e:
    print(e.reason, e.code, e.headers, sep=‘\n‘)
except error.URLError as e:
    print(e.reason)
else:
    print(‘Request Successfully‘)

Python學習筆記22（urllib模塊）

ror 轉換 decode urllib模塊 one 處理 context hello mpat Python3和Python2的urllib模塊不太一樣，本篇文章是以Python3為前提。 1.urlopen的使用 import urllib.request urll

Python學習筆記-IP地址處理模塊Ipy

模塊 python ipy IP地址處理模塊Ipy IPy模塊可以很好的輔助我們高效完成IP的規劃工作。參考：https://github.com/autocracy/python-ipy 安裝IPy模塊[[email protected]/* */ ~]#

Python學習筆記-- 利用pip安裝模塊

log 因此 require 列表 douban txt文件 sta 工具原因我們在使用Python時經常需要安裝各種模塊，而pip是一個很強大的模塊安裝工具，類似於linux的Yum一樣，安裝模塊時能自動解決依賴等，總結如下：一、安裝pip：　　安裝pytho

python學習筆記-day6-【 sys模塊, 導入模塊的方法】

容易 nbsp day6 學習筆記 com 示例 http 記錄 SYS模塊記錄下 sys模塊的用法，看著不難，但容易忘記的東西。一、sys模塊 1、常見的使用方法 2、如何導入其他模塊的python文件 3、導入同目錄下的python模塊

Python筆記五（collections模塊）

bsp 執行相關 collect 一個 python 代碼 script 如果一、什麽是模塊常見的場景：一個模塊就是一個包含了python定義和聲明的文件，文件名就是模塊名字加上.py的後綴。但其實import加載的模塊分為四個通用類別：　　

Python學習筆記十六_模塊結構調整

ima 端口號引用調用 server %s 好的 cto post 一、什麽是模塊結構調整　　當一個腳本中有大量的配置、方法及接口時，腳本往往顯得十分臃腫。為了代碼更易讀，可以將一個繁雜的腳本根據不同的功能放在不同的文件夾中分類管理，即模塊結構調整。二、模塊結構調整

python學習筆記22（運算子過載）

運算子過載不同型別的物件之間的運算子會有不同的解釋，如： print(1 + 2) print("1" + "2") #不同的型別用加法會有不同的解釋利用運算子過載實現兩個字串數字相加 class Person(object): def __init__(sel

python繪制圖形（Turtle模塊）

tle 繪制圖形 pos for port imp eth down 結束用python的Turtle模塊可以繪制很多精美的圖形，下面簡單介紹一下使用方法。需要用到的工具有python，python 的安裝這裏就不再細說。自行搜索。 1 from turtle

爬蟲二（urllib模塊）

span 訪問 b2b sta 字符串 rom seq app IT 1、在python2和python3中的差異在python2中，urllib和urllib2各有各自的功能，雖然urllib2是urllib的升級版，但是urllib2還是不能完全替代urllib，但是

python 連接oracle（cx_Oracle模塊）

mit oracle 得到 pri cursor pytho 結果 sid 關閉使用python連接oracle數據庫；1.安裝python3.0；2.安裝cx_Oracle模塊；3.安裝ORACLE_CLIENT ；（ORACLE_CLIENT和python位數保持一致

python 學習筆記二（列表推導式）

2018年年初寫了第一篇部落格，說要做一個認真的技術人 https://www.cnblogs.com/yingchen/p/8455507.html 今天已經是11月19日了，這是第二篇部落格，看來堅持確實是個好難的東西。雖然沒寫筆記，今年一年對python的使用還是可以的，今天繼續：

python學習筆記14（檔案讀寫）

檔案讀寫讀檔案 python讀檔案流程： 1、開啟檔案 2、讀檔案內容 3、關閉檔案註釋： 1、開啟檔案 open(path, flag[, encoding][, errors]) path: 要開啟檔案的路徑（路徑前加r） flag: 開啟方式： r----以只讀的方式開

python學習筆記10（迭代器）

可迭代物件與迭代器可迭代物件：可以直接作用於for迴圈的物件統稱為可迭代物件(Iterable)。可以用isinstance()去判斷一個物件是否是Iterable物件可以直接作用於for迴圈的資料型別一般分兩種 1、集合資料型別，如list、tuple、dict、set、st

python學習筆記9（字典與集合）

字典與集合字典定義: 使用鍵-值(key-value)儲存，具有極快的查詢速度注意：字典是無序的 key的特性： 1、字典中的key必須唯一 2、key必須是不可變物件 3、字串、整數等都是不可變的，可以作為key 4、list是可變的，不能作為key 思考：儲存多位學

python學習筆記19（面向物件程式設計）

面向物件程式設計基礎概念：物件：把資料及對資料的操作方法放在一起，作為一個相互依存的整體，即為物件。類：對同類物件抽象出其共性，形成類。注意：類中的大多數資料，只能用本類的方法進行處理。類通過一個簡單的外部介面與外界發生關係，物件與物件之間通過訊息進行通訊面向物件是

【轉】Python3學習筆記（urllib模塊的使用）

nal 方法 utf 網址 pin des IE tps erer 原文地址：https://www.cnblogs.com/Lands-ljk/p/5447127.html 1.基本方法 urllib.request.urlopen(url, data=None, [ti

python學習筆記(22) 模塊

lena time demo csv module pat read sys form 加載模塊：　　1.先從sys.modules裏查看是否已導入　　2.如果沒有導入，就依據sys.path路徑尋找模塊　　3.找到模塊就導入　　4.創建這個模塊的命名空間　　5.

Python Day 22（常用模塊二 hashlib configparser logging）

HA 常用 nbsp AS name -a align 常用模塊 ext Python Day 22（常用模塊二 hashlib configparser logging） hashlib configparser loggingPython Day 22（常用模塊二

python全棧開發中級班全程筆記（第二模塊、第四章）模塊（常用模塊）

span 自己文件目錄 port all mode 功能最大的維護 python全棧開發筆記第二模塊第四章：常用模塊一、定義：　　在程序開發過程中，隨著代碼越寫越多，在一個文件裏，代碼就會越來越長，越來越不容易維護。　　為了編寫更好維護的

Python中正則表達式（re模塊）的使用

python中正則表達式Python中正則表達式（re模塊）的使用1、正則表達式的概述（1）概述：正則表達式是一些由字符和特殊符號組成的字符串，他們描述了模式的重復或者表示多個字符，正則表達式能按照某種模式匹配一系列有相似特征的字符串。正則表達式是一種小型的、高度的專業化的編程語言，（2）Python語言中的

Python學習筆記22（urllib模塊）

1.urlopen的使用

2.Request的使用

3.代理

4.Cookie

5.異常處理

相關推薦