被面試官問懵：TCP 四次揮手收到亂序的 FIN 包會如何處理？

摘要：收到個讀者的問題，他在面試的時候，被搞懵了，因為面試官問了他這麼一個網路問題。

本文分享自華為雲社群《TCP 四次揮手收到亂序的 FIN 包會如何處理？》，作者：小林coding 。

收到個讀者的問題，他在面試的時候，被搞懵了，因為面試官問了他這麼一個網路問題：

不過這道網路題可能是提問的讀者表述有問題，因為如果 FIN 報文比資料包先抵達客戶端，此時 FIN 報文其實是一個亂序的報文，此時客戶端的 TCP 連線並不會從 FIN_WAIT_2 狀態轉換到 TIME_WAIT 狀態。

因此，我們要關注到點是看「在 FIN_WAIT_2 狀態下，是如何處理收到的亂序到 FIN 報文，然後 TCP 連線又是什麼時候才進入到 TIME_WAIT 狀態?」。

我這裡先直接說結論：

在 FIN_WAIT_2 狀態時，如果收到亂序的 FIN 報文，那麼就被會加入到「亂序佇列」，並不會進入到 TIME_WAIT 狀態。

等再次收到前面被網路延遲的資料包時，會判斷亂序佇列有沒有資料，然後會檢測亂序佇列中是否有可用的資料，如果能在亂序佇列中找到與當前報文的序列號保持的順序的報文，就會看該報文是否有 FIN 標誌，如果發現有 FIN 標誌，這時才會進入 TIME_WAIT 狀態。

我也畫了一張圖，大家可以結合著圖來理解。

TCP 原始碼分析

接下來，我帶大家看看原始碼，聽到要原始碼分析，可能有的同學就慫了。

其實要分析我們今天這個問題，只要懂 if else 就行了，我也會用中文來表述程式碼的邏輯，所以單純看我的文字也是可以的。

這次我們重點分析的是，在 FIN_WAIT_2 狀態下，收到 FIN 報文是如何處理的。

在 Linux 核心裡，當 IP 層處理完訊息後，會通過回撥 tcp_v4_rcv 函式將訊息轉給 TCP 層，所以這個函式就是 TCP 層收到訊息的入口。

處於 FIN_WAIT_2 狀態下的客戶端，在收到服務端的報文後，最終會呼叫 tcp_v4_do_rcv 函式。

接下來，tcp_v4_do_rcv 方法會呼叫 tcp_rcv_state_process，在這裡會根據 TCP 狀態做對應的處理，這裡我們只關注 FIN_WAIT_2 狀態。

在上面這個程式碼裡，可以看到如果 shutdown 關閉了讀方向，那麼在收到對方發來的資料包，則會回覆 RST 報文。

而我們這次的題目裡， shutdown 只關閉了寫方向，所以會繼續往下呼叫 tcp_data_queue 函式（因為 case TCP_FIN_WAIT2 程式碼塊裡並沒有 break 語句，所以會走到該函式）。

在上面的 tcp_data_queue 函式裡，如果收到的報文的序列號是我們預期的，也就是有序的話：

會判斷該報文有沒有 FIN 標誌，如果有的話就會呼叫 tcp_fin 函式，這個函式負責將 FIN_WAIT_2 狀態轉換為 TIME_WAIT。
接著還會看亂序佇列有沒有資料，如果有的話會呼叫 tcp_ofo_queue 函式，這個函式負責檢查亂序佇列中是否有資料包可用，即能不能在亂序佇列找到與當前資料包保持序列號連續的資料包。

而當收到的報文的序列號不是我們預期的，也就是亂序的話，則呼叫 tcp_data_queue_ofo 函式，將報文加入到亂序佇列，這個佇列的資料結構是紅黑樹。

我們的題目裡，客戶端收到的 FIN 報文實際上是一個亂序的報文，因此此時並不會呼叫 tcp_fin 函式進行狀態轉換，而是將報文通過 tcp_data_queue_ofo 函式加入到亂序佇列。

然後當客戶端收到被網路延遲的資料包後，此時因為該資料包的序列號是期望的，然後又因為上一次收到的亂序 FIN 報文被加入到了亂序佇列，表明亂序佇列是有資料的，於是就會呼叫 tcp_ofo_queue 函式。

我們來看看 tcp_ofo_queue 函式。

在上面的 tcp_ofo_queue 函式裡，在亂序佇列中找到能與當前報文的序列號保持的順序的報文後，會看該報文是否有 FIN 標誌，如果有的話，就會呼叫 tcp_fin() 函式。

最後，我們來看看 tcp_fin 函式的處理。

可以看到，如果當前的 TCP 狀態為 TCP_FIN_WAIT2，就會發送第四次揮手 ack，然後呼叫 tcp_time_wait 函式，這個函式裡會將 TCP 狀態變更為 TIME_WAIT，並啟動 TIME_WAIT 的定時器。

怎麼看 TCP 原始碼？

之前有不少同學問我，我是怎麼看 TCP 原始碼的？

其實我看 TCP 原始碼，並不是直接開啟 Linux 原始碼直接看，因為 Linux 原始碼實在太龐大了，如果我不知道 TCP 入口函式在哪，那簡直就是大海撈針。

所以，在看 TCP 原始碼，我們可以去網上搜索下別人的原始碼分析，網上已經有很多前輩幫我們分析了 TCP 原始碼了，而且各個函式的呼叫鏈路，他們都有寫出來了。

比如，你想了解 TCP 三次握手/四次揮手的原始碼實現，你就可以以「TCP 三次握手/四次揮手的原始碼分析」這樣關鍵字來搜尋，大部分文章的註釋寫的還是很清晰，我最開始就按這種方式來學習 TCP 原始碼的。

網上的文章一般只會將重點的部分，很多程式碼細節沒有貼出來，如果你想完整的看到函式的所有程式碼，那就得看核心程式碼了。

這裡推薦個看 Linux 核心程式碼的線上網站：https://elixir.bootlin.com/linux/latest/source

我覺得還是挺好用的，左側各個版本的程式碼都有，右上角也可以搜尋函式。

所以，我看 TCP 原始碼的經驗就是，先在網上找找前輩寫的 TCP 原始碼分析，然後知道整個函式的呼叫鏈路後，如果想具體瞭解某個函式的具體實現，可以在我說的那個看 Linux 核心程式碼的線上網站上搜索該函式，就可以看到完整的函式的實現。如果中途遇到看不懂的程式碼，也可以將這個程式碼複製到百度或者谷歌搜尋，一般也能找到別人分析的過程。

學會了看 TCP 原始碼其實有助於我們分析一些異常問題，就比如今天這道網路題目，在網上其實是搜尋不出答案的，而且我們也很難用實驗的方式來模擬。

所以要想知道答案，只能去看原始碼。

點選關注，第一時間瞭解華為雲新鮮技術~

被面試官問懵：TCP 四次揮手收到亂序的 FIN 包會如何處理？