1. 程式人生 > >Python學習筆記(四十五)網絡編程(1)TCP編程

Python學習筆記(四十五)網絡編程(1)TCP編程

包含 ipv sina spa 包括 現在 com 訪問 等等

摘抄:https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/001432004374523e495f640612f4b08975398796939ec3c000

Socket是網絡編程的一個抽象概念。通常我們用一個Socket表示“打開了一個網絡鏈接”,而打開一個Socket需要知道目標計算機的IP地址和端口號,再指定協議類型即可。

客戶端

大多數連接都是可靠的TCP連接。創建TCP連接時,主動發起連接的叫客戶端,被動響應連接的叫服務器。

舉個例子,當我們在瀏覽器中訪問新浪時,我們自己的計算機就是客戶端,瀏覽器會主動向新浪的服務器發起連接。如果一切順利,新浪的服務器接受了我們的連接,一個TCP連接就建立起來的,後面的通信就是發送網頁內容了。

所以,我們要創建一個基於TCP連接的Socket,可以這樣做:

# 導入socket庫:
import socket

# 創建一個socket: 
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM) 
# 建立連接:
s.connect((www.sina.com.cn, 80))

創建Socket時,AF_INET指定使用IPv4協議,如果要用更先進的IPv6,就指定為AF_INET6SOCK_STREAM指定使用面向流的TCP協議,這樣,一個Socket對象就創建成功,但是還沒有建立連接。

客戶端要主動發起TCP連接,必須知道服務器的IP地址和端口號。新浪網站的IP地址可以用域名www.sina.com.cn

自動轉換到IP地址,但是怎麽知道新浪服務器的端口號呢?

作為服務器,提供什麽樣的服務,端口號就必須固定下來。由於我們想要訪問網頁,因此新浪提供網頁服務的服務器必須把端口號固定在80端口,因為80端口是Web服務的標準端口。其他服務都有對應的標準端口號,例如SMTP服務是25端口,FTP服務是21端口,等等。端口號小於1024的是Internet標準服務的端口,端口號大於1024的,可以任意使用。

連接新浪服務器的代碼如下:

s.connect((www.sina.com.cn, 80))

註意參數是一個tuple,包含地址 端口號

建立TCP連接後,我們就可以向新浪服務器發送請求,要求返回首頁的內容:

# 發送數據:
s.send(bGET / HTTP/1.1\r\nHost: www.sina.com.cn\r\nConnection: close\r\n\r\n)

(\r\n : 回車換行)

TCP連接創建的是雙向通道,雙方都可以同時給對方發數據。但是誰先發誰後發,怎麽協調,要根據具體的協議來決定。例如,HTTP協議規定客戶端必須先發請求給服務器,服務器收到後才發數據給客戶端。

發送的文本格式必須符合HTTP標準,如果格式沒問題,接下來就可以接收新浪服務器返回的數據了:

# 接收數據
buffer = []
while True:
    # 每次最多接收1k字節:
    d = s.recv(1024)
    if d:
        buffer.append(d)
    else:
        break
data = b‘‘.join(buffer)

接收數據時,調用recv(max)方法,一次最多接收指定的字節數,因此,在一個while循環中反復接收,直到recv()返回空數據,表示接收完畢,退出循環。

當我們接收完數據後,調用close()方法關閉Socket,這樣,一次完整的網絡通信就結束了:

# 關閉連接:
s.close()

接收到的數據包括HTTP頭和網頁本身,我們只需要把HTTP頭和網頁分離一下,把HTTP頭打印出來網頁內容保存到文件

header, html = data.split(b\r\n\r\n, 1)      # 1是分割一次的意思
print(header.decode(utf-8))
# 把接收的數據寫入文件:
with open(sina.html, wb) as f:
    f.write(html)

現在,只需要在瀏覽器中打開這個sina.html文件,就可以看到新浪的首頁了。

服務器

服務器進程首先要綁定一個端口並監聽來自其他客戶端的連接。如果某個客戶端連接過來了,服務器就與該客戶端建立Socket連接,隨後的通信就靠這個Socket連接了。

所以,服務器會打開固定端口(比如80)監聽,每來一個客戶端連接,就創建該Socket連接。由於服務器會有大量來自客戶端的連接,所以,服務器要能夠區分一個Socket連接是和哪個客戶端綁定的。一個Socket依賴4項:服務器地址、服務器端口、客戶端地址、客戶端端口來唯一確定一個Socket。

但是服務器還需要同時響應多個客戶端的請求,所以,每個連接都需要一個新的進程或者新的線程來處理,否則,服務器一次就只能服務一個客戶端了。

我們來編寫一個簡單的服務器程序,它接收客戶端連接,把客戶端發過來的字符串加上Hello再發回去。

首先,創建一個基於IPv4和TCP協議的Socket:

Python學習筆記(四十五)網絡編程(1)TCP編程