1. 程式人生 > >CRC32為例詳細解析(菜鳥至老鳥進階)

CRC32為例詳細解析(菜鳥至老鳥進階)

CRC-知識解析 cyclic redundancy check

寫在前面的話:

之前在做學校專案的時候用到了CRC 原理,但在網上查詢的過程中,發現講解CRC知識的資源很多,但是對新手比較友好的、講的十分清楚的又很少,很多博主也不求甚解,弄得讀起來心中常常不由自主地奔騰過上千個“為什麼”“為什麼”, 本文是我在閱讀了許多資料的基礎上整理、解析出來的文章,儘可能的對新手友好、解答CRC裡面的一些知識點,而不是簡單的應用。

 

依據學習目的不同,如果大家只想簡單應用,不求原理,那麼直接複製--貼上最後的程式碼即可。

 

-----------------------------------------------------------------------這是一條華麗的分界線-----------------------------------------------------------------------------------------

1. CRC 演算法原理

在對資訊的處理過程中,我們可以將要被處理的資料塊M看成一個n階的二進位制多項式,其形式如下:

 

CRC校驗就是基於這種多項式進行的運算GF(2)(The integers modulo 2)多項式算術為數學基礎(模-2)除法的餘數運算(其實說白了就是異或Xor(見2.2)),使用的除數不同,CRC的型別也就不一樣。CRC傳輸實際上就是在長k 資料後面新增供差錯檢測(Frame Check Sequence) 用的 r 位冗餘碼(Redundant code 沒錯CRC裡面的R就是這個),使原資料構成 n = k + r 位併發送出去

, 此方式又叫(n, k)碼。可以證明存在一個最高次冪為n-k=r的多項式G(x)根據G(x)可以生成k位資訊的校驗碼,而 G(x) 叫做這個CRC碼的生成多項式( Poly )。而根據 k 值的不同,就形成了不同的CRC碼的生成多項式,以下為各種常用的多項表示式:

 

這些多項表示式的值便(模-2)除法的除數,部落格這裡選取CRC-32多項式即為對應除數)格式,通過取餘做操,獲取CRC檢驗碼

 

2. CRC 傳輸過程

2.1 傳輸原理

 

1. CRC 演算法原理 所述,將長度為 k 位的資料塊對應一個GF(2)多項式

M,以 8 位資料塊11100110舉例,如果先傳輸MSBMost Significant Bit),則它對應的多項式為x^7 + x^6 + x^5 + x^2 + x (8位對應x的7次冪,因為從x0 開始計數,2進製為1時有效)。傳送端和接收端約定一個次數為 r CRC多項式,取CRC-4 為例:x^4 + x + 1r = 4。在資料塊後面加上r0對應的多項式為M',顯然有M' = Mx^r 。用 M' 除以CRC-4 將得到一個次數等於或小於 r-1 的餘數多項式 R,其對應的 r 位數值則為校驗碼。傳送方通過指定的CRC多項式產生r位的CRC校驗碼,接收方則通過該CRC多項式來驗證收到的報文碼的CRC校驗碼是否為0

 

具體推算如下:

CRC多項式為G(x)

假設傳送資訊用資訊多項式C(x)表示,將C(x)左移 r 位,則可表示成C(x)x^r,這樣C(x)的右邊就會空出r位校驗碼的位置,使用GF(2)(模2除法),得到的餘數R就是校驗碼。傳送的CRC編碼是, 至於驗證接收到的報文編碼是否至正確,方法依然是做模2除:,若餘數為0則正確。

 

2.2 邏輯異或運算

CRC校驗是基於多項式進行的運算,其加減法運算以2為模GF(2) ,加減時不進(借)位,實際上與邏輯異或(XOR)運算是一致, XOR是將參加運算的兩個資料,按二進位制位進行“異或”運算。

異或運算規則^)規則如下:

0^0=0;  0^1=1;  1^0=1;   1^1=0;

即:參加運算的兩個物件,如果兩個相應位為“異”(值不同),則該位結果為1,否則為0。

 

2.3 傳輸計算示例

G(X)=X4+X3+1為例,設原資料為10110011

 1G(X)=X4+X3+1, 二進位制位元串為11001。( X n 次方不為02n次方的位=1 )

 2)因為校驗碼4位,所以10110011後面40,得到101100110000,用2除法 (即邏輯亦或^) 即可得出結果

 

3CRC^101100110000得到101100110100,並傳送到接收端

4)接收端收到101100110100後除以11001(2除法方式去除),餘數為0則無差錯

3. CRC 的實現(Reversed 反向校驗模式)

一般來說CRC有多種實現方式,在本文中我們以C語言為例,並給出 直接生成法查表法 兩個例子。

直接生成法 適用於 CRC 次冪較小的格式,當CRC 次冪逐漸增高時,因為其複雜的Xor 邏輯運算會拖累系統執行速度,不再建議使用直接生成法,取而代之的是查表法——將資料塊M 的一部分提前運算好,並將結果存入陣列中,系統開始執行運算時,相當於省去了之前的操作,直接從類似中間的位置開始計算,所以會提高效率

 

在計算CRC時也可以選擇正向校驗(Normal) 或者反向校驗(Reversed),由於 Normal 和 Reversed 是映象關係,兩種方法會影響到最後的校驗碼,使得兩種方式最後得到的校驗碼呈現映象關係。 但這對CRC 本身的成功率並沒有影響,只不過是: 正向走一遍,還是映象走一遍罷了。

 

為什麼還會有Reversed格式呢? 是因為在大多數硬體系統的傳輸中,普遍先發送LSB,而Reversed 的CRC 正是滿足於這種LSB First 的格式,因此適用。

 

下面為計算過程:

 

設資料塊為Mx, CRC校驗式為G(x) FCS位數為 r

如下表所示,當採取反向校驗設計時, 需進行以下操作:

Name

Polynomial Representations

Normal

Reversed

Reciprocal

Reversed reciprocal

CRC-3-GSM

0x3 

0x6 

 0x5

 0x5

CRC-8

0xD5 

 0xAB

 0x57

0xEA 

CRC-16-CCITT

0x1021 

0x8408 

0x811 

0x8810 

CRC-32

0x04C11DB7

0xEDB88320

0xDB710641

0x82608EDB

 

(1)將翻轉後的Mx^r的後r位放入一個長度為r的暫存器中;

(2)如果暫存器的首位為1,將暫存器右移1(Mx^r剩下部分的MSB移入暫存器的MSB(高八位)),再與G(x) 的後r位異或,否則僅將暫存器右移1(Mx^r剩下部分的LSB(低八位)移入暫存器的LSB)

(3)重複第2步,直到M全部 Mx^r 移入暫存器;

(4)暫存器中的值則為校驗碼。

程式碼如下(基於C語言):

unsigned int CRC;//int的大小是32位,作32位CRC暫存器
unsigned int CRC_32_Table[256];//用來儲存CRC碼錶
void GenerateCRC32_Table()
{
   for(int i=0;i<256;++i)//用++i以提高效率
{      CRC=i;
       for(int j=0;j<8;++j)
         {
           if(CRC&1)// LSM為1
           CRC=(CRC>>1)^0xEDB88320;//採取反向校驗
           else //0xEDB88320就是CRC-32多項表示式的reversed值
            CRC>>=1;
         }
     CRC_32_Table[i]=CRC;
  }
}

4. 生成多項式的選擇

不同的CRC生成多項式,其檢錯能力是不同的。要使用R位校驗碼,生成多項式的次冪應為R。同時生成多項式應該包含項"1",否則校驗碼的LSB(Least Significant Bit)將始終為0。如果資料塊M (包括校驗碼) 在傳輸過程中產生了差錯,則接收端收到的訊息可以表示為M +R。若R’ 不能被CRC 生成多項式G 除盡,則該差錯可以被檢測出。考慮以下幾種情況:

 

1) 1位差錯,即R’ = x^n = 100...00n >= 0。只要G至少有21R'就不能被G除盡。這是因為G x^k相當於將G左移k位,對任意多項式QQG相當於將多個不同的G的左移相加。如果G至少有兩位1,它的多個不同的左移相加結果至少有兩位1

 

2)奇數位差錯,只要G含有因子F = x + 1,  R' 就不能被G除盡。這是因為QG = Q'F,由1)的分析,F的多個不同的左移相加結果1的位數必然是偶數。

 

3)爆炸性差錯,即R' = (x^n + ... + 1)x^m = 1...100...00n >= 1m >= 0,顯然只要G包含項"1",且次數大於n,就不能除盡R'

 

4)2位差錯,即R' = (x^n + 1)x^m = 100...00100...00n >= 0。設x^n + 1 = QG + R,則R' = QGx^m + Rx^m,由3)可知R'能被G除盡當且僅當R0。因此只需分析x^n + 1,對於次數R,總存在一個生成多項式G,使得n最小為2^R - 1時,才能除盡x^n + 1。稱該生成多項式是原始的(primitive),它提供了在該次數上檢測2位差錯的最高能力,因為當n = 2^R - 1時,x^n + 1能被任何R次多項式除盡。

-----------------------------------------------------------------------這又是一條華麗的分界線---------------------------------------------------------------------------------------

 

5. Q & A

 

Q: 為什麼暫存器初始化置0?

 

A: 暫存器的初始值不為 0,那麼暫存器中的值就相當於是待測資料,這樣算出的 CRC 結果並不正確。再考慮CRC32 模型的 Init=0xFFFFFFFF,待測資料的內容和長度為隨機,如果暫存器初始值為 0,那麼待測位元組則為 1 位元組 0x00,計算出來的 CRC32 值也就為 0。暫存器用0xFFFFFFFF 進行初始化,就可以避免這個問題

 

 

 

Q:為什麼先移位再XOR?

 

A: 0xEDB88320已經是Gx 去掉最高項的簡寫,為了確保運算無誤,所以需要先移位再XOR。這不會影響最後的結果,因為在做XOR運算時,gx 的最高位都會被消掉(因為在除法運算中每次迴圈都是從1 開始除, 而gx 的最高項就是1,所以每次都會被消掉)

 

 

Q: 查表法的index 是什麼,而內容又是什麼?

 

A: Index 為資料塊M 的前8位,內容是前8位與CRC XOR後的值,用時需再與gx異或。

 

 

Q: 查表法為什麼會有256個字元?

 

A: 在CRC-16和32中,一次移出的待測資料為 8 位 bits,即一次進行一個位元組的計算,則表格有 2^8=256 個表值。一個位元組有8位二進位制數,每一位都有2種選擇。

 

6. 參考資料推薦

 

https://bbs.pediy.com/thread-17195.htm  (通俗解釋)

 

https://www.cnblogs.com/bugutian/p/6221783.html(解釋移位原理)

 

https://blog.csdn.net/mish84/article/details/27528125(解釋程式碼)