1. 程式人生 > >【轉載】TCP粘包問題分析和解決(全)

【轉載】TCP粘包問題分析和解決(全)

刪除 而且 實例 報文 底層 nagle 存在 ngxin 想想

TCP通信粘包問題分析和解決(全)

在socket網絡程序中,TCP和UDP分別是面向連接和非面向連接的。因此TCP的socket編程,收發兩端(客戶端和服務器端)都要有成對的socket,因此,發送端為了將多個發往接收端的包,更有效的發到對方,使用了優化方法(Nagle算法),將多次間隔較小、數據量小的數據,合並成一個大的數據塊,然後進行封包。這樣,接收端,就難於分辨出來了,必須提供科學的拆包機制。

對於UDP,不會使用塊的合並優化算法,這樣,實際上目前認為,是由於UDP支持的是一對多的模式,所以接收端的skbuff(套接字緩沖區)采用了鏈式結構來記錄每一個到達的UDP包,在每個UDP包中就有了消息頭(消息來源地址,端口等信息),這樣,對於接收端來說,就容易進行區分處理了。所以UDP不會出現粘包問題。

====================================================================

在介紹TCP之前先普及下兩個相關的概念,長連接和短連接。

1.長連接

Client方與Server方先建立通訊連接,連接建立後 不斷開, 然後再進行報文發送和接收。

2.短連接

Client方與Server每進行一次報文收發交易時才進行通訊連接,交易完畢後立即斷開連接。此種方式常用於一點對多點通訊,比如多個Client連接一個Server.

TCP協議簡介

TCP是一個面向連接的傳輸層協議,雖然TCP不屬於ISO制定的協議集,但由於其在商業界和工業界的成功應用,它已成為事實上的網絡標準,廣泛應用於各種網絡主機間的通信。

作為一個面向連接的傳輸層協議,TCP的目標是為用戶提供可靠的端到端連接,保證信息有序無誤的傳輸。它除了提供基本的數據傳輸功能外,還為保證可靠性采用了數據編號、校驗和計算、數據確認等一系列措施。它對傳送的每個數據字節都進行編號,並請求接收方回傳確認信息(ACK)。發送方如果在規定的時間內沒有收到數據確認,就重傳該數據。

(1) 數據編號使接收方能夠處理數據的失序和重復問題。

(2) 數據誤碼問題通過在每個傳輸的數據段中增加校驗和予以解決,接收方在接收到數據後檢查校驗和,若校驗和有誤,則丟棄該有誤碼的數據段,並要求發送方重傳。

(3) 流量控制也是保證可靠性的一個重要措施,若無流控,可能會因接收緩沖區溢出而丟失大量數據,導致許多重傳,造成網絡擁塞惡性循環。

(4) TCP采用可變窗口進行流量控制,由接收方控制發送方發送的數據量。

TCP為用戶提供了高可靠性的網絡傳輸服務,但可靠性保障措施也影響了傳輸效率。因此,在實際工程應用中,只有關鍵數據的傳輸才采用TCP,而普通數據的傳輸一般采用高效率的UDP。

保護消息邊界和流

那麽什麽是保護消息邊界和流呢?

保護消息邊界,就是指傳輸協議把數據當作一條獨立的消息在網上傳輸,接收端只能接收獨立的消息。也就是說存在保護消息邊界,接收端一次只能接收發送端發出的一個數據包。而面向流則是指無保護消息保護邊界的,如果發送端連續發送數據,接收端有可能在一次接收動作中,會接收兩個或者更多的數據包。

例如,我們連續發送三個數據包,大小分別是2k,4k ,8k,這三個數據包,都已經到達了接收端的網絡堆棧中,如果使用UDP協議,不管我們使用多大的接收緩沖區去接收數據,我們必須有三次接收動作,才能夠把所有的數據包接收完.而使用TCP協議,我們只要把接收的緩沖區大小設置在14k以上,我們就能夠一次把所有的數據包接收下來,只需要有一次接收動作。

註意:

這就是因為UDP協議的保護消息邊界使得每一個消息都是獨立的。而流傳輸卻把數據當作一串數據流,他不認為數據是一個一個的消息。所以有很多人在使用tcp協議通訊的時候,並不清楚tcp是基於流的傳輸,當連續發送數據的時候,他們時常會認識tcp會丟包。其實不然,因為當他們使用的緩沖區足夠大時,他們有可能會一次接收到兩個甚至更多的數據包,而很多人往往會忽視這一點,只解析檢查了第一個數據包,而已經接收的其他數據包卻被忽略了。所以大家如果要作這類的網絡編程的時候,必須要註意這一點。

結論:

(1)TCP為了保證可靠傳輸,盡量減少額外開銷(每次發包都要驗證),因此采用了流式傳輸,面向流的傳輸,相對於面向消息的傳輸,可以減少發送包的數量,從而減少了額外開銷。但是,對於數據傳輸頻繁的程序來講,使用TCP可能會容易粘包。當然,對接收端的程序來講,如果機器負荷很重,也會在接收緩沖裏粘包。這樣,就需要接收端額外拆包,增加了工作量。因此,這個特別適合的是數據要求可靠傳輸,但是不需要太頻繁傳輸的場合(兩次操作間隔100ms,具體是由TCP等待發送間隔決定的,取決於內核中的socket的寫法)

(2)UDP,由於面向的是消息傳輸,它把所有接收到的消息都掛接到緩沖區的接受隊列中,因此,它對於數據的提取分離就更加方便,但是,它沒有粘包機制,因此,當發送數據量較小的時候,就會發生數據包有效載荷較小的情況,也會增加多次發送的系統發送開銷(系統調用,寫硬件等)和接收開銷。因此,應該最好設置一個比較合適的數據包的包長,來進行UDP數據的發送。(UDP最大載荷為1472,因此最好能每次傳輸接近這個數的數據量,這特別適合於視頻,音頻等大塊數據的發送,同時,通過減少握手來保證流媒體的實時性

====================================================================

粘包問題分析與對策

TCP粘包是指發送方發送的若幹包數據到接收方接收時粘成一包,從接收緩沖區看,後一包數據的頭緊接著前一包數據的尾。

出現粘包現象的原因是多方面的,它既可能由發送方造成,也可能由接收方造成。

什麽時候需要考慮粘包問題

1如果利用tcp每次發送數據,就與對方建立連接,然後雙方發送完一段數據後,就關閉連接,這樣就不會出現粘包問題(因為只有一種包結構,類似於http協議)。

關閉連接主要是要雙方都發送close連接(參考tcp關閉協議)。如:A需要發送一段字符串給B,那麽A與B建立連接,然後發送雙方都默認好的協議字符如"hello give me sth abour yourself",然後B收到報文後,就將緩沖區數據接收,然後關閉連接,這樣粘包問題不用考慮到,因為大家都知道是發送一段字符。

2如果發送數據無結構,如文件傳輸,這樣發送方只管發送,接收方只管接收存儲就ok,也不用考慮粘包3如果雙方建立連接,需要在連接後一段時間內發送不同結構數據,如連接後,有好幾種結構:

1)"hellogive me sth abour yourself"

2)"Don‘tgive me sth abour yourself"

那這樣的話,如果發送方連續發送這個兩個包出去,接收方一次接收可能會是"hellogive me sth abour yourselfDon‘t give me sth abour yourself"這樣接收方就傻了,到底是要幹嘛?不知道,因為協議沒有規定這麽詭異的字符串,所以要處理把它分包,怎麽分也需要雙方組織一個比較好的包結構,所以一般可能會在頭加一個數據長度之類的包,以確保接收。

粘包出現原因

簡單得說,在流傳輸中出現,UDP不會出現粘包,因為它有消息邊界(參考Windows網絡編程)

1發送端需要等緩沖區滿才發送出去,造成粘包

2接收方不及時接收緩沖區的包,造成多個包接收

具體點:

(1)發送方引起的粘包是由TCP協議本身造成的,TCP為提高傳輸效率,發送方往往要收集到足夠多的數據後才發送一包數據。若連續幾次發送的數據都很少,通常TCP會根據優化算法把這些數據合成一包後一次發送出去,這樣接收方就收到了粘包數據。

(2)接收方引起的粘包是由於接收方用戶進程不及時接收數據,從而導致粘包現象。這是因為接收方先把收到的數據放在系統接收緩沖區,用戶進程從該緩沖區取數據,若下一包數據到達時前一包數據尚未被用戶進程取走,則下一包數據放到系統接收緩沖區時就接到前一包數據之後,而用戶進程根據預先設定的緩沖區大小從系統接收緩沖區取數據,這樣就一次取到了多包數據。

粘包情況有兩種,一種是粘在一起的包都是完整的數據包,另一種情況是粘在一起的包有不完整的包。

不是所有的粘包現象都需要處理,若傳輸的數據為不帶結構的連續流數據(如文件傳輸),則不必把粘連的包分開(簡稱分包)。但在實際工程應用中,傳輸的數據一般為帶結構的數據,這時就需要做分包處理。

在處理定長結構數據的粘包問題時,分包算法比較簡單;在處理不定長結構數據的粘包問題時,分包算法就比較復雜。特別是粘在一起的包有不完整的包的粘包情況,由於一包數據內容被分在了兩個連續的接收包中,處理起來難度較大。實際工程應用中應盡量避免出現粘包現象。

為了避免粘包現象,可采取以下幾種措施:

(1)對於發送方引起的粘包現象,用戶可通過編程設置來避免,TCP提供了強制數據立即傳送的操作指令push,TCP軟件收到該操作指令後,就立即將本段數據發送出去,而不必等待發送緩沖區滿;

(2)對於接收方引起的粘包,則可通過優化程序設計、精簡接收進程工作量、提高接收進程優先級等措施,使其及時接收數據,從而盡量避免出現粘包現象;

(3)由接收方控制,將一包數據按結構字段,人為控制分多次接收,然後合並,通過這種手段來避免粘包。

以上提到的三種措施,都有其不足之處。

(1)第一種編程設置方法雖然可以避免發送方引起的粘包,但它關閉了優化算法,降低了網絡發送效率,影響應用程序的性能,一般不建議使用。

(2)第二種方法只能減少出現粘包的可能性,但並不能完全避免粘包,當發送頻率較高時,或由於網絡突發可能使某個時間段數據包到達接收方較快,接收方還是有可能來不及接收,從而導致粘包。

(3)第三種方法雖然避免了粘包,但應用程序的效率較低,對實時應用的場合不適合。

一種比較周全的對策是:接收方創建一預處理線程,對接收到的數據包進行預處理,將粘連的包分開。對這種方法我們進行了實驗,證明是高效可行的。

具體可以參考:http://blog.csdn.net/soli/article/details/1297109

TCP無保護消息邊界的解決

針對這個問題,一般有3種解決方案:

(1)發送固定長度的消息

(2)把消息的尺寸與消息一塊發送

(3)使用特殊標記來區分消息間隔

其解決方法具體解決可以參考:http://blog.csdn.net/zhangxinrun/article/details/6721427

====================================================================

網絡通訊的封包和拆包

對於基於TCP開發的通訊程序,有個很重要的問題需要解決,就是封包和拆包。

為什麽基於TCP的通訊程序需要進行封包和拆包

TCP是個"流"協議,所謂流,就是沒有界限的一串數據,大家可以想想河裏的流水,是連成一片的,其間是沒有分界線的。但一般通訊程序開發是需要定義一個個相互獨立的數據包的,比如用於登陸的數據包,用於註銷的數據包。由於TCP"流"的特性以及網絡狀況,在進行數據傳輸時會出現以下幾種情況。

假設我們連續調用兩次send分別發送兩段數據data1和data2,在接收端有以下幾種接收情況(當然不止這幾種情況,這裏只列出了有代表性的情況).

A.先接收到data1,然後接收到data2.

B.先接收到data1的部分數據,然後接收到data1余下的部分以及data2的全部.

C.先接收到了data1的全部數據和data2的部分數據,然後接收到了data2的余下的數據.

D.一次性接收到了data1和data2的全部數據.

對於A這種情況正是我們需要的,不再做討論.對於B,C,D的情況就是大家經常說的"粘包",就需要我們把接收到的數據進行拆包,拆成一個個獨立的數據包,為了拆包就必須在發送端進行封包。

另:對於UDP來說就不存在拆包的問題,因為UDP是個"數據包"協議,也就是兩段數據間是有界限的,在接收端要麽接收不到數據要麽就是接收一個完整的一段數據,不會少接收也不會多接收。

為什麽會出現B.C.D的情況

1.由Nagle算法造成的發送端的粘包:Nagle算法是一種改善網絡傳輸效率的算法.簡單的說,當我們提交一段數據給TCP發送時,TCP並不立刻發送此段數據,而是等待一小段時間,看看在等待期間是否還有要發送的數據,若有則會一次把這兩段數據發送出去.這是對Nagle算法一個簡單的解釋,詳細的請看相關書籍. C和D的情況就有可能是Nagle算法造成的.

2.接收端接收不及時造成的接收端粘包:TCP會把接收到的數據存在自己的緩沖區中,然後通知應用層取數據.當應用層由於某些原因不能及時的把TCP的數據取出來,就會造成TCP緩沖區中存放了幾段數據.

怎樣封包和拆包

最初遇到"粘包"的問題時,我是通過在兩次send之間調用sleep來休眠一小段時間來解決。這個解決方法的缺點是顯而易見的,使傳輸效率大大降低,而且也並不可靠。後來就是通過應答的方式來解決,盡管在大多數時候是可行的,但是不能解決B的那種情況,而且采用應答方式增加了通訊量,加重了網絡負荷. 再後來就是對數據包進行封包和拆包的操作。

封包

封包就是給一段數據加上包頭,這樣一來數據包就分為包頭和包體兩部分內容了(以後講過濾非法包時封包會加入"包尾"內容)。包頭其實上是個大小固定的結構體,其中有個結構體成員變量表示包體的長度,這是個很重要的變量,其他的結構體成員可根據需要自己定義。根據包頭長度固定以及包頭中含有包體長度的變量就能正確的拆分出一個完整的數據包。

拆包

對於拆包目前我最常用的是以下兩種方式:

(1)動態緩沖區暫存方式。之所以說緩沖區是動態的是因為當需要緩沖的數據長度超出緩沖區的長度時會增大緩沖區長度。

大概過程描述如下:

A,為每一個連接動態分配一個緩沖區,同時把此緩沖區和SOCKET關聯,常用的是通過結構體關聯.

B,當接收到數據時首先把此段數據存放在緩沖區中.

C,判斷緩存區中的數據長度是否夠一個包頭的長度,如不夠,則不進行拆包操作.

D,根據包頭數據解析出裏面代表包體長度的變量.

E,判斷緩存區中除包頭外的數據長度是否夠一個包體的長度,如不夠,則不進行拆包操作.

F,取出整個數據包.這裏的"取"的意思是不光從緩沖區中拷貝出數據包,而且要把此數據包從緩存區中刪除掉.刪除的辦法就是把此包後面的數據移動到緩沖區的起始地址.

這種方法有兩個缺點.

1) 為每個連接動態分配一個緩沖區增大了內存的使用.

2) 有三個地方需要拷貝數據,一個地方是把數據存放在緩沖區,一個地方是把完整的數據包從緩沖區取出來,一個地方是把數據包從緩沖區中刪除.第二種拆包的方法會解決和完善這些缺點.

前面提到過這種方法的缺點.下面給出一個改進辦法, 即采用環形緩沖.但是這種改進方法還是不能解決第一個缺點以及第一個數據拷貝,只能解決第三個地方的數據拷貝(這個地方是拷貝數據最多的地方).第2種拆包方式會解決這兩個問題.

環形緩沖實現方案是定義兩個指針,分別指向有效數據的頭和尾.在存放數據和刪除數據時只是進行頭尾指針的移動.

(2)利用底層的緩沖區來進行拆包

由於TCP也維護了一個緩沖區,所以我們完全可以利用TCP的緩沖區來緩存我們的數據,這樣一來就不需要為每一個連接分配一個緩沖區了。另一方面我們知道recv或者wsarecv都有一個參數,用來表示我們要接收多長長度的數據。利用這兩個條件我們就可以對第一種方法進行優化。

對於阻塞SOCKET來說,我們可以利用一個循環來接收包頭長度的數據,然後解析出代表包體長度的那個變量,再用一個循環來接收包體長度的數據。

編程實現見:http://blog.csdn.net/zhangxinrun/article/details/6721495


這個問題產生於編程中遇到的幾個問題:

1、使用TCP的Socket發送數據的時候,會出現發送出錯,WSAEWOULDBLOCK,在TCP中不是會保證發送的數據能夠安全的到達接收端的嗎?也有窗口機制去防止發送速度過快,為什麽還會出錯呢?

2、TCP協議,在使用Socket發送數據的時候,每次發送一個包,接收端是完整的接受到一個包還是怎麽樣?如果是每發一個包,就接受一個包,為什麽還會出現粘包問題,具體是怎麽運行的?

3、關於Send,是不是只有在非阻塞狀態下才會出現實際發送的比指定發送的小?在阻塞狀態下會不會出現實際發送的比指定發送的小,就是說只能出現要麽全發送,要麽不發送?在非阻塞狀態下,如果之發送了一些數據,要怎麽處理,調用了Send函數後,發現返回值比指定的要小,具體要怎麽做?

4、最後一個問題,就是TCP/IP協議和Socket是什麽關系?是指具體的實現上,Socket是TCP/IP的實現?那麽為什麽會出現使用TCP協議的Socket會發送出錯。


這個問題第1個回答:

1應該是你的緩沖區不夠大,

2 tcp是流,沒有界限.也就沒所謂的包.

3阻塞也會出現這種現象,出現後繼續發送沒發送出去的.

4tcp是協議,socket是一種接口,沒必然聯系.錯誤取決於你使用接口的問題,跟tcp沒關系.


這個問題第2個回答:

1、應該不是緩沖區大小問題,我試過設置緩沖區大小,不過這裏有個問題,就是就算我把緩沖區設置成幾G,也返回成功,不過實際上怎麽可能設置那麽大

3、出現沒發送完的時候要手動發送吧,有沒有具體的代碼實現?

4、當選擇TCP的Socket發送數據的時候,TCP中的窗口機制不是能防止發送速度過快的嗎?為什麽Socket在出現了WSAEWOULDBLOCK後沒有處理?


這個問題第3個回答:

1.在使用非阻塞模式的情況下,如果系統發送緩沖區已滿,並示及時發送到對端,就會產生該錯誤,繼續重試即可。

3.如果沒有發完就繼續發送後續部分即可。


這個問題第4個回答:

1、使用非阻塞模式時,如果當前操作不能立即完成則會返回失敗,錯誤碼是WSAEWOULDBLOCK,這是正常的,程序可以先執行其它任務,過一段時間後再重試該操作。

2、發送與接收不是一一對應的,TCP會把各次發送的數據重新組合,可能合並也可能拆分,但發送次序是不變的。

3、在各種情況下都要根據send的返回值來確定發送了多少數據,沒有發送完就再接著發。

4、socket是Windows提供網絡編程接口,TCP/IP是網絡傳輸協議,使用socket是可以使用多種協議,其中包括TCP/IP。


這個問題第5個回答:

發送的過程是:發送到緩沖區和從緩沖區發送到網絡上

WSAEWOULDBLOCK和粘包都是出現在發送到緩沖區這個過程的


Socket編程 (異步通訊,解決Tcp粘包)

前面提到,TCP會出現粘包問題,下面將以實例演示解決方案:

問題一般會出現的情況如下,假設我們連續發送兩條兩天記錄("我是liger_zql"):

模擬發送示例:

#region 測試消息發送,並匹配協議

TcpClient client =new TcpClient();

client.AsynConnect();

Console.WriteLine("下面將連續發送2條測試消息...");

Console.ReadKey();

MessageProtocol msgPro;

for (int i = 0; i<2; i++)

{

msgPro =newMessageProtocol("我是liger_zql");

Console.WriteLine("第{0}條:{1}", i +1,msgPro.MessageInfo.Content);

client.AsynSend(msgPro);

}

#endregion

接收端接受兩條信息會出現如下三種情況:

1.(1)我是liger_zql(2)我是liger_zql

2.(1)我是liger_zql我是(2)liger_zql

3.(1)我是liger_zql我是liger_zql

通過以上三種情況,顯然2、3都不是我們想要的結果。那麽如何處理這中情況呢?

解決方案:通過自定義協議...

我們可以以將信息以xml的格式發送出去,列入<protocol>content</protocol>通過正則匹配信息是否完整,如果不完整,我們可以先將本次接受信息緩存接受下一次信息,再次匹配得到相應的結果。

(1)將信息對象轉換成一定格式的xml字符串:

(2)對接收的信息通過正則進行匹配處理:

(3)將該定義的協議換換成信息對象,通過對象獲取自己想要的信息。

結果:

最後運行結果如下

技術分享

附上源碼:SocketProQuests.zip

詳細可參考:http://www.cnblogs.com/zengqinglei/archive/2013/05/14/3078842.html

附:
關於Socket/TCP粘包、多包和少包, 斷包:http://tsing01.blog.163.com/blog/static/2059572832012716103711125/

關於Tcp封包粘包問題:http://www.cnblogs.com/jiangtong/archive/2012/03/22/2411985.html

TCP通訊處理粘包詳解:http://www.cnblogs.com/smark/p/3284756.html

參考:

http://hi.baidu.com/chongerfeia/blog/item/b1e572f631dd7e28bd310965.html

http://blog.csdn.net/binghuazh/archive/2009/05/28/4222516.aspx

http://blog.csdn.net/zhangxinrun/article/details/6721495

【轉自】http://www.cnblogs.com/kex1n/p/6502002.html

【轉載】TCP粘包問題分析和解決(全)