1. 程式人生 > >解決TCP網路傳輸“粘包”問題(經典)

解決TCP網路傳輸“粘包”問題(經典)

轉載連結:http://blog.csdn.net/zhangxinrun/article/details/6721508

當前在網路傳輸應用中,廣泛採用的是TCP/IP通訊協議及其標準的socket應用開發程式設計介面(API)。TCP/IP傳輸層有兩個並列的協議:TCP和UDP。其中TCP(transport control protocol,傳輸控制協議)是面向連線的,提供高可靠性服務。UDP(user datagram protocol,使用者資料報協議)是無連線的,提供高效率服務。在實際工程應用中,對可靠性和效率的選擇取決於應用的環境和需求。一般情況下,普通資料的網路傳輸採用高效率的udp,重要資料的網路傳輸採用高可靠性的TCP。

在應用開發過程中,筆者發現基於TCP網路傳輸的應用程式有時會出現粘包現象(即傳送方傳送的若干包資料到接收方接收時粘成一包)。針對這種情況,我們進行了專題研究與實驗。本文重點分析了TCP網路粘包問題,並結合實驗結果提出瞭解決該問題的對策和方法,供有關工程技術人員參考。

一、TCP協議簡介

  TCP是一個面向連線的傳輸層協議,雖然TCP不屬於iso制定的協議集,但由於其在商業界和工業界的成功應用,它已成為事實上的網路標準,廣泛應用於各種網路主機間的通訊。

  作為一個面向連線的傳輸層協議,TCP的目標是為使用者提供可靠的端到端連線,保證資訊有序無誤的傳輸。它除了提供基本的資料傳輸功能外,還為保證可靠性採用了資料編號、校驗和計算、資料確認等一系列措施。它對傳送的每個資料位元組都進行編號,並請求接收方回傳確認資訊(ack)。傳送方如果在規定的時間內沒有收到資料確認,就重傳該資料。資料編號使接收方能夠處理資料的失序和重複問題。資料誤碼問題通過在每個傳輸的資料段中增加校驗和予以解決,接收方在接收到資料後檢查校驗和,若校驗和有誤,則丟棄該有誤碼的資料段,並要求傳送方重傳。流量控制也是保證可靠性的一個重要措施,若無流控,可能會因接收緩衝區溢位而丟失大量資料,導致許多重傳,造成網路擁塞惡性迴圈。TCP採用可變視窗進行流量控制,由接收方控制傳送方傳送的資料量。

  TCP為使用者提供了高可靠性的網路傳輸服務,但可靠性保障措施也影響了傳輸效率。因此,在實際工程應用中,只有關鍵資料的傳輸才採用TCP,而普通資料的傳輸一般採用高效率的udp。

二、粘包問題分析與對策

  TCP粘包是指傳送方傳送的若干包資料到接收方接收時粘成一包,從接收緩衝區看,後一包資料的頭緊接著前一包資料的尾。

  出現粘包現象的原因是多方面的,它既可能由傳送方造成,也可能由接收方造成。傳送方引起的粘包是由TCP協議本身造成的,TCP為提高傳輸效率,傳送方往往要收集到足夠多的資料後才傳送一包資料。若連續幾次傳送的資料都很少,通常TCP會根據優化演算法把這些資料合成一包後一次傳送出去,這樣接收方就收到了粘包資料。接收方引起的粘包是由於接收方使用者程序不及時接收資料,從而導致粘包現象。這是因為接收方先把收到的資料放在系統接收緩衝區,使用者程序從該緩衝區取資料,若下一包資料到達時前一包資料尚未被使用者程序取走,則下一包資料放到系統接收緩衝區時就接到前一包資料之後,而使用者程序根據預先設定的緩衝區大小從系統接收緩衝區取資料,這樣就一次取到了多包資料(圖1所示)。

 
圖1

 
圖2

 
圖3 

  粘包情況有兩種,一種是粘在一起的包都是完整的資料包(圖1、圖2所示),另一種情況是粘在一起的包有不完整的包(圖3所示),此處假設使用者接收緩衝區長度為m個位元組。

  不是所有的粘包現象都需要處理,若傳輸的資料為不帶結構的連續流資料(如檔案傳輸),則不必把粘連的包分開(簡稱分包)。但在實際工程應用中,傳輸的資料一般為帶結構的資料,這時就需要做分包處理。

  在處理定長結構資料的粘包問題時,分包演算法比較簡單;在處理不定長結構資料的粘包問題時,分包演算法就比較複雜。特別是如圖3所示的粘包情況,由於一包資料內容被分在了兩個連續的接收包中,處理起來難度較大。實際工程應用中應儘量避免出現粘包現象。

  為了避免粘包現象,可採取以下幾種措施。一是對於傳送方引起的粘包現象,使用者可通過程式設計設定來避免,TCP提供了強制資料立即傳送的操作指令push,TCP軟體收到該操作指令後,就立即將本段資料傳送出去,而不必等待發送緩衝區滿;二是對於接收方引起的粘包,則可通過優化程式設計、精簡接收程序工作量、提高接收程序優先順序等措施,使其及時接收資料,從而儘量避免出現粘包現象;三是由接收方控制,將一包資料按結構欄位,人為控制分多次接收,然後合併,通過這種手段來避免粘包。

  以上提到的三種措施,都有其不足之處。第一種程式設計設定方法雖然可以避免傳送方引起的粘包,但它關閉了優化演算法,降低了網路傳送效率,影響應用程式的效能,一般不建議使用。第二種方法只能減少出現粘包的可能性,但並不能完全避免粘包,當傳送頻率較高時,或由於網路突發可能使某個時間段資料包到達接收方較快,接收方還是有可能來不及接收,從而導致粘包。第三種方法雖然避免了粘包,但應用程式的效率較低,對實時應用的場合不適合。

  一種比較周全的對策是:接收方建立一預處理執行緒,對接收到的資料包進行預處理,將粘連的包分開。對這種方法我們進行了實驗,證明是高效可行的。

、程式設計與實現

  1.實現框架

  實驗網路通訊程式採用TCP/IP協議的socket api程式設計實現。socket是面向客戶機/伺服器模型的。TCP實現框架如圖4所示。

圖4

  2.實驗硬體環境:

  伺服器:pentium 350 微機

  客戶機:pentium 166微機

  網路平臺:由10兆共享式hub連線而成的區域網

  3.實驗軟體環境:

  作業系統:windows 98

  程式語言:visual c++ 5.0

  4.主要執行緒

  程式設計採用多執行緒方式,伺服器端共有兩個執行緒:傳送資料執行緒、傳送統計顯示執行緒。客戶端共有三個執行緒:接收資料執行緒、接收預處理粘包執行緒、接收統計顯示執行緒。其中,傳送和接收執行緒優先順序設為thread_priority_time_critical(最高優先順序),預處理執行緒優先順序為thread_priority_above_normal(高於普通優先順序),顯示執行緒優先順序為thread_priority_normal(普通優先順序)。

  實驗傳送資料的資料結構如圖5所示:

圖5

  5.分包演算法

  針對三種不同的粘包現象,分包演算法分別採取了相應的解決辦法。其基本思路是首先將待處理的接收資料流(長度設為m)強行轉換成預定的結構資料形式,並從中取出結構資料長度欄位,即圖5中的n,而後根據n計算得到第一包資料長度。

  1)若n<m,則表明資料流包含多包資料,從其頭部擷取n個位元組存入臨時緩衝區,剩餘部分資料依此繼續迴圈處理,直至結束。

  2)若n=m,則表明資料流內容恰好是一完整結構資料,直接將其存入臨時緩衝區即可。

  3)若n>m,則表明資料流內容尚不夠構成一完整結構資料,需留待與下一包資料合併後再行處理。

  對分包演算法具體內容及軟體實現有興趣者,可與作者聯絡。

四、實驗結果分析

  實驗結果如下:

  1.在上述實驗環境下,當傳送方連續傳送的若干包資料長度之和小於1500b時,常會出現粘包現象,接收方經預處理執行緒處理後能正確解開粘在一起的包。若程式中設定了“傳送不延遲”:(setsockopt (socket_name,ipproto_tcp,tcp_nodelay,(char *) &on,sizeof on) ,其中on=1),則不存在粘包現象。

  2.當傳送資料為每包1kb~2kb的不定長資料時,若傳送間隔時間小於10ms,偶爾會出現粘包,接收方經預處理執行緒處理後能正確解開粘在一起的包。

  3.為測定處理粘包的時間,傳送方依次迴圈傳送長度為1.5kb、1.9kb、1.2kb、1.6kb、1.0kb資料,共計1000包。為製造粘包現象,接收執行緒每次接收前都等待10ms,接收緩衝區設為5000b,結果接收方收到526包資料,其中長度為5000b的有175包。經預處理執行緒處理可得到1000包正確資料,粘包處理總時間小於1ms。

  實驗結果表明,TCP粘包現象確實存在,但可通過接收方的預處理予以解決,而且處理時間非常短(實驗中1000包資料總共處理時間不到1ms),幾乎不影響應用程式的正常工作。

相關推薦

解決TCP網路傳輸”問題經典

轉載連結:http://blog.csdn.net/zhangxinrun/article/details/6721508 當前在網路傳輸應用中,廣泛採用的是TCP/IP通訊協議及其標準的socket應用開發程式設計介面(API)。TCP/IP傳輸層有兩個並列的協議:TCP

TCP網路傳輸”問題,經典解決附程式碼

一、前言         關於TCP網路傳輸粘包,網上很多人寫了原理。總結起來就一句話(這裡拿Server和Client長連線,Server和Client之間通過信令傳輸做說明) Server傳送的時候,雖然按照一條條信令傳送,經過網路傳輸,到達客戶端作業系統網路層,首先進

tcp資料傳輸&的產生和解決

recv會不斷取出緩衝區中內容,如果一次沒有拿完,那麼下面繼續收取沒拿完的資訊。 tcp粘包: 指的是傳送方傳送若干次資料的時候,因為是資料流的傳輸方式,導致資料粘連在一起,接收方一次將多次傳送的資料一起接收,產生接收資料的粘連。 粘包是tcp傳輸特有的現

網路傳輸處理

有時候傳送的資料過長,接收的時候只接收了一部分,會出現錯誤。這裡以客戶端接收服務端訊息為例,講解一種解包的方法,作為備忘(總是忘沒辦法) 1.客戶端有一段緩衝區char m_szAnalysisBuf[51200] 成員變數,用於存放接收資料,在回撥函式收到資料後,判斷緩衝

關於IOS一些有的沒的 – TCP資料傳輸

TCP資料傳輸粘包 場景 在工作中用到一個模組,一個房間,使用者在其中進行聊天,視訊,互動以及何種資料的傳輸,採用的方案是採用TCP/IP通訊協議及標準的socket應用開發程式設計 問題 其中遇到一個現象,資料粘包,具體體現是:在一段較短的時間內,

經典TCP分析

分配 網絡通訊 有一種 解析 全部 簡單 進程 影響 大小 一 .兩個簡單概念長連接與短連接:1.長連接 Client方與Server方先建立通訊連接,連接建立後不斷開, 然後再進行報文發送和接收。 2.短連接 Client方與Server每進行一次報文收發

C#.網路程式設計 Socket基礎 WPF系統Socket TCP協議 伺服器與客戶端 不同型別檔案傳輸,同時解決UI執行緒與工作執行緒的卡頓問題

一、簡介 雖然,本文的前面幾篇文章在WinForm中實現了Socket TCP協議 伺服器與客戶端 不同型別檔案傳輸,詳情見 但是,卻沒有在WPF中實現 Socket TCP協議 伺服器與客戶端 不同型別檔案傳輸。因此,本文將描述如何在WPF中實現該功能。

tcp協議產生-問題的解決方案

import col 執行 port == pan 字符 use utf8 客戶端 1 客戶端 2 3 from socket import * 4 import json,struct 5 6 7 client=socket(AF_INET,SOCK

tcp協議下問題的產生及解決方案

ont phone 系統 pac 接收 實的 msg 來源 erro 1、粘包產生原因: (1)TCP為提高傳輸效率,發送方往往要收集到足夠多的數據後才發送一個TCP段。若連續幾次需要send的數據都很少,通常TCP會根據優化算法(Nagle)把這些數據合成一個TCP段後一

python 網路程式設計解決方案2 + ftp上傳 + socketserver

一。struct 神奇的打包工具 struct    程式碼: import struct num = 156 #將int型別的資料打包成4個位元組的資料 num_stru = struct.pack('i',num) print(len(num_stru)) print

用wireshark抓分析TCP三次握手、四次揮手以及TCP實現可靠傳輸的機制

關於TCP三次握手和四次揮手大家都在《計算機網路》課程裡學過,還記得當時高超老師耐心地講解。大學裡我遇到的最好的老師大概就是這位了,雖然他只給我講過《java程式設計》和《計算機網路》,但每次課幾乎都動手敲程式碼或者當場做實驗。好了不扯了,下面進入正題。      關

基於tcp協議下現象和解決方案

一、緩衝區   每個 socket 被建立後,都會分配兩個緩衝區,輸入緩衝區和輸出緩衝區。write()/send() 並不立即向網路中傳輸資料,而是先將資料寫入緩衝區中,再由TCP協議將資料從緩衝區傳送到目標機器。一旦將資料寫入到緩衝區,函式就可以成功返回,不管它們有沒有到達目標機器,也不管它們何時被髮送

Linux 網路程式設計 全解--------TCP三次握手、資料傳輸、四次揮手、滑動視窗

寫在前面:今天中秋佳節,首先祝大家佳節快樂,身體健康,恭喜發財。吃也吃了,喝也喝了,玩也玩了,乾點正事吧。 說一下寫這個系列的目的,隨著對物聯網開發的深入,越來越覺得自己網路基礎知識的薄弱,雖然開發過程中不需要對網路基礎有很深入的瞭解照樣能進行,但有一些問題仍然是不知其因,

C#.網路程式設計 Socket基礎 基於WinForm系統Socket TCP協議 實現端到端伺服器與客戶端.txt.word.png等不同型別檔案傳輸

一、簡介: 前面的兩篇介紹了字串傳輸、圖片傳輸: 其實,本文針對Socket基礎(二)進一步完成,以便可以進行多種檔案傳輸。 二、基於不同的流(檔案流、記憶體流、網路等)讀寫。 1、圖片傳輸 方法一:(在客戶端用檔案流傳送(即將圖片寫到檔案流去,以便傳送),

python網路程式設計--解決方案 subprocess

1.緩衝區:作用:將程式和網路解耦分為輸入緩衝區, 輸出緩衝區  每個 socket 被建立後,都會分配兩個緩衝區,輸入緩衝區和輸出緩衝區。write()/send() 並不立即向網路中傳輸資料,而是先將資料寫入緩衝區中,再由TCP協議將資料從緩衝區傳送到目標機器。一旦將資料寫入到緩衝區,函式就可以成功返回,

TCP 出現分包的原因 以及解決辦法

轉載: 粘包產生原因: 先說TCP:由於TCP協議本身的機制(面向連線的可靠地協議-三次握手機制)客戶端與伺服器會維持一個連線(Channel),資料在連線不斷開的情況下,可以持續不斷地將多個數據包發往伺服器,但是如果傳送的網路資料包太小,那麼他本身會啟用Nagle演算

解決網路資料的問題

一個網路上來的資料包之後,我們必需將收到的資料包整理成為一個一個的完成的資料包.這裡寫了一個程式碼來搞定這個問題的.首先我們需要有一個記憶體緩衝區.還有我們已經使用了這個緩衝區的大小的標誌. void getData(const char* buff,int nSize){ 

3、netty、拆

list ride int 簡化 iter getclass null message som 上篇博客留了個尾巴“而且LineBasedFrameDecoder據說還有一種不要求攜帶結束符的解碼方式”,今天就從源碼來看看是怎麽回事。 一、基本原理 如果沒有netty,

python學習_day30_基於tcp協議的現象

接收數據 循環 tle ddr err shel starting 發生 dump 1、基於遠程執行命令的程序   需用到subprocess模塊 服務端: #1、執行客戶端發送的指令 import socket import subprocess phone=socke

hdu 2126 Buy the souvenirs 【輸出方案數】【01背經典

continue with election i++ targe ref https contest col 題目鏈接:https://vjudge.net/contest/103424#problem/K 題目大意: 給n個物品,和m塊錢,輸出能夠購買最多物品的個數和購買