1. 程式人生 > >Python(15)_爬區百度網頁並儲存

Python(15)_爬區百度網頁並儲存

import  urllib.request
url ='http://www.baidu.com'
response = urllib.request.urlopen(url=url)
#print(response)  # 列印物件
#print(type(response))
'''獲取返回的內容,read()得到的是二進位制的,要將二進位制轉換為str型,需要decode()方法'''
# print(response.read().decode())  #
# with open('baidu.html','w',encoding='utf-8',) as fp:
#     fp.write(response.read().decode())
# 根據響應內容獲取到請求url print("根據響應內容獲取請求url: "+response.geturl()) #print(response.getheaders()) # 得到是列表,獲取請求頭 print(dict(response.getheaders())) # 列表轉換成字典,就可以獲取對應的鍵值對了 print(response.getcode()) # 獲取返回碼 # print(response.readlines()) 按行讀取,一般不用 ''' 直接以二進位制儲存下來''' with open('baidu1.html','wb') as fp1: fp1.write(response.read())