javaweb學習總結(十)——TCP三次握手 四次握手
在談及TCP建立連線和釋放連線過程,先來簡單認識一下TCP報文段首部格式的的幾個名詞
序列號seq:佔4個位元組,用來標記資料段的順序,TCP把連線中傳送的所有資料位元組都編上一個序號,第一個位元組的編號由本地隨機產生;給位元組編上序號後,就給每一個報文段指派一個序號;序列號seq就是這個報文段中的第一個位元組的資料編號。 確認號ack:佔4個位元組,期待收到對方下一個報文段的第一個資料位元組的序號;序列號表示報文段攜帶資料的第一個位元組的編號;而確認號指的是期望接收到下一個位元組的編號;因此當前報文段最後一個位元組的編號+1即為確認號。 確認ACK:
PS:ACK、SYN和FIN這些大寫的單詞表示標誌位,其值要麼是1,要麼是0;ack、seq小寫的單詞表示序號。
一、TCP建立連線三次握手
TCP三次握手是TCP一個比較重點的內容,來學習一下。
TCP三次握手其實就是TCP連線建立的過程,三次握手的目的是同步連線雙方的序列號和確認號並交換TCP視窗大小資訊。下面是TCP三次握手的流程圖:
整個流程為:
- 客戶端主動開啟,傳送連線請求報文段,將SYN標識位置為1,Sequence Number置為x(TCP規定SYN=1時不能攜帶資料,x為隨機產生的一個值),然後進入SYN_SEND狀態
- 伺服器收到SYN報文段進行確認,將SYN標識位置為1,ACK置為1,Sequence Number置為y,Acknowledgment Number置為x+1,然後進入SYN_RECV狀態,這個狀態被稱為半連線狀態
- 客戶端再進行一次確認,將ACK置為1(此時不用SYN),Sequence Number置為x+1,Acknowledgment Number置為y+1發向伺服器,最後客戶端與伺服器都進入ESTABLISHED狀態
為什麼在第3步中客戶端還要再進行一次確認呢?
這主要是為了防止已經失效的連線請求報文段突然又傳回到服務端而產生錯誤的場景:
所謂"已失效的連線請求報文段"是這樣產生的。正常來說,客戶端發出連線請求,但因為連線請求報文丟失而未收到確認。於是客戶端再次發出一次連線請求,後來收到了確認,建立了連線。資料傳輸完畢後,釋放了連線,客戶端一共傳送了兩個連線請求報文段,其中第一個丟失,第二個到達了服務端,沒有"已失效的連線請求報文段"。
現在假定一種異常情況,即客戶端發出的第一個連線請求報文段並沒有丟失,只是在某些網路節點長時間滯留了,以至於延誤到連線釋放以後的某個時間點才到達服務端。本來這個連線請求已經失效了,但是服務端收到此失效的連線請求報文段後,就誤認為這是客戶端又發出了一次新的連線請求。於是服務端又向客戶端發出請求報文段,同意建立連線。假定不採用三次握手,那麼只要服務端發出確認,連線就建立了。
由於現在客戶端並沒有發出連線建立的請求,因此不會理會服務端的確認,也不會向服務端傳送資料,但是服務端卻以為新的傳輸連線已經建立了,並一直等待客戶端發來資料,這樣服務端的許多資源就這樣白白浪費了。
採用三次握手的辦法可以防止上述現象的發生。比如在上述的場景下,客戶端不向服務端的發出確認請求,服務端由於收不到確認,就知道客戶端並沒有要求建立連線。
二、TCP釋放連線四次握手
TCP三次握手是TCP連線建立的過程,TCP四次握手則是TCP連線釋放的過程。下面是TCP四次握手的流程圖:
(1)四次握手過程
假設主機A為客戶端,主機B為伺服器,其釋放TCP連線的過程如下:
1) 關閉客戶端到伺服器的連線:首先客戶端A傳送一個FIN,用來關閉客戶到伺服器的資料傳送,然後等待伺服器的確認。其中終止標誌位FIN=1,序列號seq=u
2) 伺服器收到這個FIN,它發回一個ACK,確認號ack為收到的序號加1。 3) 關閉伺服器到客戶端的連線:也是傳送一個FIN給客戶端。 4) 客戶段收到FIN後,併發回一個ACK報文確認,並將確認序號seq設定為收到序號加1。
首先進行關閉的一方將執行主動關閉,而另一方執行被動關閉。
主機A傳送FIN後,進入終止等待狀態, 伺服器B收到主機A連線釋放報文段後,就立即給主機A傳送確認,然後伺服器B就進入close-wait狀態,此時TCP伺服器程序就通知高層應用程序,因而從A到B的連線就釋放了。此時是“半關閉”狀態。即A不可以傳送給B,但是B可以傳送給A。
此時,若B沒有資料報要傳送給A了,其應用程序就通知TCP釋放連線,然後傳送給A連線釋放報文段,並等待確認。A傳送確認後,進入time-wait,注意,此時TCP連線還沒有釋放掉,然後經過時間等待計時器設定的2MSL後,A才進入到close狀態。
(2)為什麼要等待2MSL呢? MSL即Maximum Segment Lifetime,也就是最大報文生存時間,他是任何報文在網路上存在的最長時間,超過這個時間報文將被丟棄。引用《TCP/IP詳解》中的話:“它(MSL)是任何報文段被丟棄前在網路內的最長時間”。RFC 793中規定MSL為2分鐘,實際應用中常用的是30秒,1分鐘和2分鐘等。
TCP的TIME_WAIT狀態需要等待2MSL,當TCP的一端發起主動關閉,在發出最後一個ACK包後,即第3次握手完成後傳送了第四次握手的ACK包後就進入了TIME_WAIT狀態,必須在此狀態上停留兩倍的MSL時間,等待2MSL時間主要目的是防止最後一個ACK包對方沒收到,那麼對方在超時後將重發第三次握手的FIN包,主動關閉端接到重發的FIN包後可以再發一個ACK應答包。在TIME_WAIT狀態時兩端的埠不能使用,要等到2MSL時間結束才可繼續使用。當連線處於2MSL等待階段時任何遲到的報文段都將被丟棄。不過在實際應用中可以通過設定SO_REUSEADDR選項達到不必等待2MSL時間結束再使用此埠。
概括原因如下:
①、為了保證A傳送的最後一個ACK報文段能夠到達B。即最後這個確認報文段很有可能丟失,那麼B會超時重傳,然後A再一次確認,同時啟動2MSL計時器,如此下去。如果沒有等待時間,傳送完確認報文段就立即釋放連線的話,B就無法重傳了(連線已被釋放,任何資料都不能出傳了),因而也就收不到確認,就無法按照步驟進入CLOSE狀態,即必須收到確認才能close。 ②、防止“已失效的連線請求報文段”出現在連線中。經過2MSL,那些在這個連線持續的時間內,產生的所有報文段就可以都從網路中消失。即在這個連線釋放的過程中會有一些無效的報文段滯留在樓閣結點,但是呢,經過2MSL這些無效報文段就肯定可以傳送到目的地,不會滯留在網路中。這樣的話,在下一個連線中就不會出現上一個連線遺留下來的請求報文段了。 可以看出:B結束TCP連線的時間比A早一點,因為B收到確認就斷開連線了,而A還得等待2MSL.
(3)為什麼TCP釋放連線需要四次?
TCP建立連線要進行三次握手,而斷開連線要進行四次。這是由於TCP的半關閉造成的。因為TCP連線是全雙工的(即資料可在兩個方向上同時傳遞)所以進行關閉時每個方向上都要單獨進行關閉。這個單方向的關閉就叫半關閉。當一方完成它的資料傳送任務,就傳送一個FIN來向另一方通告將要終止這個方向的連線。
注意:
1)傳送了FIN只是表示這端不能繼續傳送資料(應用層不能再呼叫send傳送),但是還可以接收資料。收到一個 FIN只意味著這一方向上沒有資料流動,一個TCP連線在收到一個FIN後仍能傳送資料,比如:如主機A收到主機B的FIN斷開TCP連線請求,只是表示主機B已經發送完資料,主機A收到FIN後作出應答,並終止這個方向的資料傳輸,此時處於半關閉狀態。但是主機A仍然可以傳送資料的,只有當主機A傳送完資料併發送FIN給主機B時,主機B才停止這個方向的資料傳輸,並關閉TCP連線。
2)在很多時候,TCP連線的斷開都會由TCP層自動進行,例如你CTRL+C終止你的程式,TCP連線依然會正常關閉。