摘要:收到個讀者的問題,他在面試的時候,被搞懵了,因為面試官問了他這麼一個網路問題。
本文分享自華為雲社群《TCP 四次揮手收到亂序的 FIN 包會如何處理?》,作者:小林coding 。
收到個讀者的問題,他在面試的時候,被搞懵了,因為面試官問了他這麼一個網路問題:
不過這道網路題可能是提問的讀者表述有問題,因為如果 FIN 報文比資料包先抵達客戶端,此時 FIN 報文其實是一個亂序的報文,此時客戶端的 TCP 連線並不會從 FIN_WAIT_2 狀態轉換到 TIME_WAIT 狀態。
因此,我們要關注到點是看「在 FIN_WAIT_2 狀態下,是如何處理收到的亂序到 FIN 報文,然後 TCP 連線又是什麼時候才進入到 TIME_WAIT 狀態?」。
我這裡先直接說結論:
在 FIN_WAIT_2 狀態時,如果收到亂序的 FIN 報文,那麼就被會加入到「亂序佇列」,並不會進入到 TIME_WAIT 狀態。
等再次收到前面被網路延遲的資料包時,會判斷亂序佇列有沒有資料,然後會檢測亂序佇列中是否有可用的資料,如果能在亂序佇列中找到與當前報文的序列號保持的順序的報文,就會看該報文是否有 FIN 標誌,如果發現有 FIN 標誌,這時才會進入 TIME_WAIT 狀態。
我也畫了一張圖,大家可以結合著圖來理解。
TCP 原始碼分析
接下來,我帶大家看看原始碼,聽到要原始碼分析,可能有的同學就慫了。
其實要分析我們今天這個問題,只要懂 if else 就行了,我也會用中文來表述程式碼的邏輯,所以單純看我的文字也是可以的。
這次我們重點分析的是,在 FIN_WAIT_2 狀態下,收到 FIN 報文是如何處理的。
在 Linux 核心裡,當 IP 層處理完訊息後,會通過回撥 tcp_v4_rcv 函式將訊息轉給 TCP 層,所以這個函式就是 TCP 層收到訊息的入口。
處於 FIN_WAIT_2 狀態下的客戶端,在收到服務端的報文後,最終會呼叫 tcp_v4_do_rcv 函式。
接下來,tcp_v4_do_rcv 方法會呼叫 tcp_rcv_state_process,在這裡會根據 TCP 狀態做對應的處理,這裡我們只關注 FIN_WAIT_2 狀態。
在上面這個程式碼裡,可以看到如果 shutdown 關閉了讀方向,那麼在收到對方發來的資料包,則會回覆 RST 報文。
而我們這次的題目裡, shutdown 只關閉了寫方向,所以會繼續往下呼叫 tcp_data_queue 函式(因為 case TCP_FIN_WAIT2 程式碼塊裡並沒有 break 語句,所以會走到該函式)。
在上面的 tcp_data_queue 函式裡,如果收到的報文的序列號是我們預期的,也就是有序的話:
- 會判斷該報文有沒有 FIN 標誌,如果有的話就會呼叫 tcp_fin 函式,這個函式負責將 FIN_WAIT_2 狀態轉換為 TIME_WAIT。
- 接著還會看亂序佇列有沒有資料,如果有的話會呼叫 tcp_ofo_queue 函式,這個函式負責檢查亂序佇列中是否有資料包可用,即能不能在亂序佇列找到與當前資料包保持序列號連續的資料包。
而當收到的報文的序列號不是我們預期的,也就是亂序的話,則呼叫 tcp_data_queue_ofo 函式,將報文加入到亂序佇列,這個佇列的資料結構是紅黑樹。
我們的題目裡,客戶端收到的 FIN 報文實際上是一個亂序的報文,因此此時並不會呼叫 tcp_fin 函式進行狀態轉換,而是將報文通過 tcp_data_queue_ofo 函式加入到亂序佇列。
然後當客戶端收到被網路延遲的資料包後,此時因為該資料包的序列號是期望的,然後又因為上一次收到的亂序 FIN 報文被加入到了亂序佇列,表明亂序佇列是有資料的,於是就會呼叫 tcp_ofo_queue 函式。
我們來看看 tcp_ofo_queue 函式。
在上面的 tcp_ofo_queue 函式裡,在亂序佇列中找到能與當前報文的序列號保持的順序的報文後,會看該報文是否有 FIN 標誌,如果有的話,就會呼叫 tcp_fin() 函式。
最後,我們來看看 tcp_fin 函式的處理。
可以看到,如果當前的 TCP 狀態為 TCP_FIN_WAIT2,就會發送第四次揮手 ack,然後呼叫 tcp_time_wait 函式,這個函式裡會將 TCP 狀態變更為 TIME_WAIT,並啟動 TIME_WAIT 的定時器。
怎麼看 TCP 原始碼?
之前有不少同學問我,我是怎麼看 TCP 原始碼的?
其實我看 TCP 原始碼,並不是直接開啟 Linux 原始碼直接看,因為 Linux 原始碼實在太龐大了,如果我不知道 TCP 入口函式在哪,那簡直就是大海撈針。
所以,在看 TCP 原始碼,我們可以去網上搜索下別人的原始碼分析,網上已經有很多前輩幫我們分析了 TCP 原始碼了,而且各個函式的呼叫鏈路,他們都有寫出來了。
比如,你想了解 TCP 三次握手/四次揮手的原始碼實現,你就可以以「TCP 三次握手/四次揮手的原始碼分析」這樣關鍵字來搜尋,大部分文章的註釋寫的還是很清晰,我最開始就按這種方式來學習 TCP 原始碼的。
網上的文章一般只會將重點的部分,很多程式碼細節沒有貼出來,如果你想完整的看到函式的所有程式碼,那就得看核心程式碼了。
這裡推薦個看 Linux 核心程式碼的線上網站:https://elixir.bootlin.com/linux/latest/source
我覺得還是挺好用的,左側各個版本的程式碼都有,右上角也可以搜尋函式。
所以,我看 TCP 原始碼的經驗就是,先在網上找找前輩寫的 TCP 原始碼分析,然後知道整個函式的呼叫鏈路後,如果想具體瞭解某個函式的具體實現,可以在我說的那個看 Linux 核心程式碼的線上網站上搜索該函式,就可以看到完整的函式的實現。如果中途遇到看不懂的程式碼,也可以將這個程式碼複製到百度或者谷歌搜尋,一般也能找到別人分析的過程。
學會了看 TCP 原始碼其實有助於我們分析一些異常問題,就比如今天這道網路題目,在網上其實是搜尋不出答案的,而且我們也很難用實驗的方式來模擬。
所以要想知道答案,只能去看原始碼。