1. 程式人生 > >【轉】二維碼生成原理

【轉】二維碼生成原理

char 方法 選擇 規則 什麽是 fff mode 進行 數字相加

原文鏈接:QR碼生成原理-QR Code(ISO 18004)編碼方式

一、什麽是QR碼

QR碼屬於矩陣式二維碼中的一個種類,由DENSO(日本電裝)公司開發,由JIS和ISO將其標準化。QR碼的樣子其實在很多場合已經能夠被看到了,我這還是貼個圖展示一下:

技術分享圖片

這個圖如果被正確解碼,應該看到我的名字和郵箱。

二、QR碼的特點

  說到QR碼的特點:

  一是高速讀取(QR就是取自“Quick Response”的首字母),對讀取速度的體驗源自於我手機上的一個軟件,象上面貼出的碼圖,通過攝像頭從拍攝到解碼到顯示內容也就三秒左右,對攝像的角度也沒有什麽要求;

  二是高容量、高密度;理論上內容經過壓縮處理後可以存7089個數字,4296 個字母和數字混合字符,2953個8位字節數據,1817個漢字;

  三是支持糾錯處理;糾錯處理相對復雜,目前我還沒有深入了解,按照QR碼的標準文檔說明,QR碼的糾錯分為4個級別,分別是:

    level L : 最大 7% 的錯誤能夠被糾正;

    level M : 最大 15% 的錯誤能夠被糾正;

    level Q : 最大 25% 的錯誤能夠被糾正;

    level H : 最大 30% 的錯誤能夠被糾正;

  四是結構化;看似無規則的圖形,其實對區域有嚴格的定義,下圖就是一個模式2、版本1的QR圖結構(關於QR碼的"模式"、"版本"將在後面進行介紹):

技術分享圖片

  在上圖21*21的矩陣中,黑白的區域在QR碼規範中被指定為固定的位置,稱為尋像圖形(finder pattern) 和 定位圖形(timing pattern)。尋像圖形和定位圖形用來幫助解碼程序確定圖形中具體符號的坐標。

  黃色的區域用來保存被編碼的數據內容以及糾錯信息碼。

  藍色的區域,用來標識糾錯的級別(也就是Level L到Level H)和所謂的"Mask pattern",這個區域被稱為“格式化信息”(format information)。

五是擴展能力。QR碼的Structure Append特點,使一個QR碼可以分解成多個QR碼,反之,也可以將多個QR碼的數據組合到一個QR碼中來:

技術分享圖片

三、QR碼的模式和版本

  前面提到過QR碼的模式(Model)和版本(Version)。QR碼分為Model1和Model2兩種模式,Model1是對QR的初始定義,Model2是對Model1的擴展,目前使用較為普遍的是Model2,本文的所有說明也僅用於Model2。

  QR圖的大小(size)被定義為版本(Version),版本號從1到40。版本1就是一個21*21的矩陣,每增加一個版本號,矩陣的大小就增 加4個模塊(Module),因此,版本40就是一個177*177的矩陣。(版本越高,意味著存儲的內容越多,糾錯能力也越強)。

四、QR碼支持的編碼內容

  QR碼支持編碼的內容包括純數字、數字和字符混合編碼、8位字節碼和包含漢字在內的多字節字符。其中:

    數字:每三個為一組壓縮成10bit。

    字母數字混合:每兩個為一組,壓縮成11bit。

    8bit字節數據:無壓縮直接保存。

    多字節字符:每一個字符被壓縮成13bit。

五、QR碼編碼原理(編碼)

編碼就是把常見的數字、字符等轉換成QR碼的方法。說具體的編碼之前,先說一下QR碼的最大容量問題。

5.1 最大容量

QR碼的最大容量取決於選擇的版本、糾錯級別和編碼模式(Mode:數字、字符、多字節字符等)。以版本1、糾錯級別為Level Q的QR碼為例,可以存儲27個純數字,或17個字母數字混合字符或11個8bit字節數據。如果要存儲同樣多的內容同時提高糾錯級別,則需要采用更高的 版本。版本1~9 數據容量、糾錯碼容量對照如下表:

(version)

(error correcting level)

(count of data code words)

count of EC code words

(numeric)

(alphanumeric)

8bit

1

L

19

7

41

25

17

M

16

10

34

20

14

Q

13

13

27

16

11

H

9

17

17

10

7

2

L

34

10

77

47

32

M

28

16

63

38

26

Q

22

22

48

29

20

H

16

28

34

20

14

3

L

55

15

127

77

53

M

44

26

101

61

42

Q

34

36

77

47

32

H

26

44

58

35

24

4

L

80

20

187

114

78

M

64

36

149

90

62

Q

48

52

111

67

46

H

36

64

82

50

34

5

L

108

26

255

154

106

M

86

48

202

122

84

Q

62

72

144

87

60

H

46

88

106

64

44

6

L

136

36

322

195

134

M

108

64

255

154

106

Q

76

96

175

108

74

H

60

112

139

84

58

7

L

156

40

370

224

154

M

124

72

293

178

122

Q

88

108

207

125

86

H

66

130

154

93

64

8

L

194

48

461

279

192

M

154

88

365

221

152

Q

110

132

259

157

108

H

86

156

202

122

84

9

L

232

60

552

335

230

M

182

110

432

262

180

Q

132

160

312

189

130

H

100

192

235

143

98

如果要了解更詳細的QR碼容量信息,可以到電裝的網站去看看:

http://www.denso-wave.com/qrcode/vertable1-e.html。

下面,就舉例說明將“ABCDE123”轉換成為版本1、Level H的QR碼轉換方法。

5.2 模式標識符(Mode Indicator)

QR碼的模式(Mode)就是前文提到的數字、字符、8bit 字節碼、多字節碼等。對於不同的模式,都有對應的模式標識符(Mode Indicator)來幫助解碼程序進行匹配,模式標識符是4bit的二進制數:

1、數字模式(numeric mode ): 0001

2、混合字符模式(alphanumeric mode) : 0010

3、8bit byte mode: 0100

4、日本漢字(KANJI mode) : 1000

5、中國漢字(GB2312):1101

由於示例文本串是混合字符,因此將選擇alphanumeric mode,其標識碼為:0010

5.3 文本串計數標識符(Character count indicator)

文本串計數標識符用來存儲源內容字符串的長度,在版本1-9的QR碼中,文本串長度標識符自身的長度被定義為:

數字 : 10bit

混合字符 : 9bit

8bit 字節碼 : 8bit

多字節碼 : 8bit

在本例中,源文本串的長度為8個字符,混合字符的長度為9bit,因此將字符個數8編碼為9位二進制表示:000001000

加上混合字符模式標識碼,總的編碼為0010 000001000

5.4 數據內容編碼

1、數字模式下的編碼

在數字模式下,數據被限制為3個數字一段,分成若幹段。如:"123456" 將分成"123" 和 "456",分別被編碼成10bit的二進制數。“123”的10bit二進制表示法為:0001111011,實際上就是二進制的123。

當數據的長度不足3個數字時,如果只有1個數字則用4bit,如果有2個數字就用7個bit來表示。
如:"9876"被分成"987"和"6"兩段,因此被表示為"1111011011 0110"。

2、混合字符模式下的編碼

混合字符模式編碼,其字符對照表如下:

0

0

A

10

K

20

U

30

+

40

1

1

B

11

L

21

V

31

-

41

2

2

C

12

M

22

W

32

.

42

3

3

D

13

N

23

X

33

/

43

4

4

E

14

O

24

Y

34

:

44

5

5

F

15

P

25

Z

35

6

6

G

16

Q

26

[sp]

36

7

7

H

17

R

27

$

37

8

8

I

18

S

28

%

38

9

9

J

19

T

29

*

3

編碼方式為:

源碼被分成兩個字符一段,如下所示,每段的第一個字符乘上45,再用第二個數字相加。因此每段變成了11bit的2進制碼,如果字符個數只有1個,則用6bit表示。

示例:

"AB"

"CD"

"E1"

"23"

45*10+11

45*12+13

45*14+1

45*2+3

461

553

631

93

0010

000001000

00111001101

01000101001

01001110111

00001011101

3、8bit字節數據不經編碼轉換直接保存。

5.5 編碼終止符(Terminator)

如果編碼後的字符長度不足當前版本和糾錯級別所存儲的容量,則在後續補"0000",如果容量已滿則無需添加終止符。此時得到的編碼串為:

0010 000001000 00111001101 01000101001 01001110111 00001011101 0000

5.6 編成8bit碼字(Code words)

將以上的編碼再按8bit一組,形成碼字(code words):

00100000 01000001 11001101 01000101 00101001 11011100 00101110 10000

如果尾部數據不足8bit,則在尾部充0:

00100000 01000001 11001101 01000101 00101001 11011100 00101110 10000000

如果編碼後的數據不足版本及糾錯級別的最大容量,則在尾部補充 "11101100" 和"00010001",直到全部填滿。最後,版本1、Level H下的"ABCDE123" 的QR碼是:

00100000 01000001 11001101 01000101 00101001 11011100 00101110 10000000 11101100

十進制表示法為:

32 65 205 69 41 220 46 128 236

QR碼編碼原理(日本漢字和中文編碼)

一、日本漢字(KANJI)是兩個字節表示的字符碼,編碼的方式是將其轉換為13字節的二進制碼制。

轉換步驟為:

1、對於JIS值為8140(hex) 到9FFC(hex)之間字符:

a)將待轉換的JIS值減去8140(hex);

b)將高位字節乘以C0(hex);

c)將b)步驟生成的數據加上低位字節;

d)將結果轉換為13位二進制串。

2、對於JIS值為E040(hex)到EBBF(hex)之間的字符:

a)將待轉換的JIS值減去C140(hex);

b)將高位字節乘以C0(hex);

c)將b)步驟生成的數據加上低位字節;

d)將結果轉換為13位二進制串。

二、中文漢字的與日文漢字轉換步驟相似:

1、對於第一字節為0xA1~0xAA之間,第二字節在0xA1~0xFE之間字符:

a)第一字節減去0xA1;

b)上一步結果乘以0x60;

c)第二字節減去0xA1;

d)將b)步驟的結果加上c步驟的結果;

e)將結果轉換為13位二進制串。

1、對於第一字節為0xB0~0xFA之間,第二字節在0xA1~0xFE之間字符:

a)第一字節減去0xA6;

b)上一步結果乘以0x60;

c)第二字節減去0xA1;

d)將b)步驟的結果加上c步驟的結果;

e)將結果轉換為13位二進制串。

【轉】二維碼生成原理