【轉】二維碼生成原理
原文鏈接:QR碼生成原理-QR Code(ISO 18004)編碼方式
一、什麽是QR碼
QR碼屬於矩陣式二維碼中的一個種類,由DENSO(日本電裝)公司開發,由JIS和ISO將其標準化。QR碼的樣子其實在很多場合已經能夠被看到了,我這還是貼個圖展示一下:
這個圖如果被正確解碼,應該看到我的名字和郵箱。
二、QR碼的特點
說到QR碼的特點:
一是高速讀取(QR就是取自“Quick Response”的首字母),對讀取速度的體驗源自於我手機上的一個軟件,象上面貼出的碼圖,通過攝像頭從拍攝到解碼到顯示內容也就三秒左右,對攝像的角度也沒有什麽要求;
二是高容量、高密度;理論上內容經過壓縮處理後可以存7089個數字,4296 個字母和數字混合字符,2953個8位字節數據,1817個漢字;
三是支持糾錯處理;糾錯處理相對復雜,目前我還沒有深入了解,按照QR碼的標準文檔說明,QR碼的糾錯分為4個級別,分別是:
level L : 最大 7% 的錯誤能夠被糾正;
level M : 最大 15% 的錯誤能夠被糾正;
level Q : 最大 25% 的錯誤能夠被糾正;
level H : 最大 30% 的錯誤能夠被糾正;
四是結構化;看似無規則的圖形,其實對區域有嚴格的定義,下圖就是一個模式2、版本1的QR圖結構(關於QR碼的"模式"、"版本"將在後面進行介紹):
在上圖21*21的矩陣中,黑白的區域在QR碼規範中被指定為固定的位置,稱為尋像圖形(finder pattern) 和 定位圖形(timing pattern)。尋像圖形和定位圖形用來幫助解碼程序確定圖形中具體符號的坐標。
黃色的區域用來保存被編碼的數據內容以及糾錯信息碼。
藍色的區域,用來標識糾錯的級別(也就是Level L到Level H)和所謂的"Mask pattern",這個區域被稱為“格式化信息”(format information)。
五是擴展能力。QR碼的Structure Append特點,使一個QR碼可以分解成多個QR碼,反之,也可以將多個QR碼的數據組合到一個QR碼中來:
三、QR碼的模式和版本
前面提到過QR碼的模式(Model)和版本(Version)。QR碼分為Model1和Model2兩種模式,Model1是對QR的初始定義,Model2是對Model1的擴展,目前使用較為普遍的是Model2,本文的所有說明也僅用於Model2。
QR圖的大小(size)被定義為版本(Version),版本號從1到40。版本1就是一個21*21的矩陣,每增加一個版本號,矩陣的大小就增 加4個模塊(Module),因此,版本40就是一個177*177的矩陣。(版本越高,意味著存儲的內容越多,糾錯能力也越強)。
四、QR碼支持的編碼內容
QR碼支持編碼的內容包括純數字、數字和字符混合編碼、8位字節碼和包含漢字在內的多字節字符。其中:
數字:每三個為一組壓縮成10bit。
字母數字混合:每兩個為一組,壓縮成11bit。
8bit字節數據:無壓縮直接保存。
多字節字符:每一個字符被壓縮成13bit。
五、QR碼編碼原理(編碼)
編碼就是把常見的數字、字符等轉換成QR碼的方法。說具體的編碼之前,先說一下QR碼的最大容量問題。
5.1 最大容量
QR碼的最大容量取決於選擇的版本、糾錯級別和編碼模式(Mode:數字、字符、多字節字符等)。以版本1、糾錯級別為Level Q的QR碼為例,可以存儲27個純數字,或17個字母數字混合字符或11個8bit字節數據。如果要存儲同樣多的內容同時提高糾錯級別,則需要采用更高的 版本。版本1~9 數據容量、糾錯碼容量對照如下表:
(version) |
(error correcting level) |
(count of data code words) |
count of EC code words |
(numeric) |
(alphanumeric) |
8bit |
1 |
L |
19 |
7 |
41 |
25 |
17 |
M |
16 |
10 |
34 |
20 |
14 |
|
Q |
13 |
13 |
27 |
16 |
11 |
|
H |
9 |
17 |
17 |
10 |
7 |
|
2 |
L |
34 |
10 |
77 |
47 |
32 |
M |
28 |
16 |
63 |
38 |
26 |
|
Q |
22 |
22 |
48 |
29 |
20 |
|
H |
16 |
28 |
34 |
20 |
14 |
|
3 |
L |
55 |
15 |
127 |
77 |
53 |
M |
44 |
26 |
101 |
61 |
42 |
|
Q |
34 |
36 |
77 |
47 |
32 |
|
H |
26 |
44 |
58 |
35 |
24 |
|
4 |
L |
80 |
20 |
187 |
114 |
78 |
M |
64 |
36 |
149 |
90 |
62 |
|
Q |
48 |
52 |
111 |
67 |
46 |
|
H |
36 |
64 |
82 |
50 |
34 |
|
5 |
L |
108 |
26 |
255 |
154 |
106 |
M |
86 |
48 |
202 |
122 |
84 |
|
Q |
62 |
72 |
144 |
87 |
60 |
|
H |
46 |
88 |
106 |
64 |
44 |
|
6 |
L |
136 |
36 |
322 |
195 |
134 |
M |
108 |
64 |
255 |
154 |
106 |
|
Q |
76 |
96 |
175 |
108 |
74 |
|
H |
60 |
112 |
139 |
84 |
58 |
|
7 |
L |
156 |
40 |
370 |
224 |
154 |
M |
124 |
72 |
293 |
178 |
122 |
|
Q |
88 |
108 |
207 |
125 |
86 |
|
H |
66 |
130 |
154 |
93 |
64 |
|
8 |
L |
194 |
48 |
461 |
279 |
192 |
M |
154 |
88 |
365 |
221 |
152 |
|
Q |
110 |
132 |
259 |
157 |
108 |
|
H |
86 |
156 |
202 |
122 |
84 |
|
9 |
L |
232 |
60 |
552 |
335 |
230 |
M |
182 |
110 |
432 |
262 |
180 |
|
Q |
132 |
160 |
312 |
189 |
130 |
|
H |
100 |
192 |
235 |
143 |
98 |
如果要了解更詳細的QR碼容量信息,可以到電裝的網站去看看:
http://www.denso-wave.com/qrcode/vertable1-e.html。
下面,就舉例說明將“ABCDE123”轉換成為版本1、Level H的QR碼轉換方法。
5.2 模式標識符(Mode Indicator)
QR碼的模式(Mode)就是前文提到的數字、字符、8bit 字節碼、多字節碼等。對於不同的模式,都有對應的模式標識符(Mode Indicator)來幫助解碼程序進行匹配,模式標識符是4bit的二進制數:
1、數字模式(numeric mode ): 0001
2、混合字符模式(alphanumeric mode) : 0010
3、8bit byte mode: 0100
4、日本漢字(KANJI mode) : 1000
5、中國漢字(GB2312):1101
由於示例文本串是混合字符,因此將選擇alphanumeric mode,其標識碼為:0010
5.3 文本串計數標識符(Character count indicator)
文本串計數標識符用來存儲源內容字符串的長度,在版本1-9的QR碼中,文本串長度標識符自身的長度被定義為:
數字 : 10bit
混合字符 : 9bit
8bit 字節碼 : 8bit
多字節碼 : 8bit
在本例中,源文本串的長度為8個字符,混合字符的長度為9bit,因此將字符個數8編碼為9位二進制表示:000001000
加上混合字符模式標識碼,總的編碼為0010 000001000
5.4 數據內容編碼
1、數字模式下的編碼
在數字模式下,數據被限制為3個數字一段,分成若幹段。如:"123456" 將分成"123" 和 "456",分別被編碼成10bit的二進制數。“123”的10bit二進制表示法為:0001111011,實際上就是二進制的123。
當數據的長度不足3個數字時,如果只有1個數字則用4bit,如果有2個數字就用7個bit來表示。
如:"9876"被分成"987"和"6"兩段,因此被表示為"1111011011 0110"。
2、混合字符模式下的編碼
混合字符模式編碼,其字符對照表如下:
0 |
0 |
|
A |
10 |
|
K |
20 |
|
U |
30 |
|
+ |
40 |
1 |
1 |
|
B |
11 |
|
L |
21 |
|
V |
31 |
|
- |
41 |
2 |
2 |
|
C |
12 |
|
M |
22 |
|
W |
32 |
|
. |
42 |
3 |
3 |
|
D |
13 |
|
N |
23 |
|
X |
33 |
|
/ |
43 |
4 |
4 |
|
E |
14 |
|
O |
24 |
|
Y |
34 |
|
: |
44 |
5 |
5 |
|
F |
15 |
|
P |
25 |
|
Z |
35 |
|||
6 |
6 |
|
G |
16 |
|
Q |
26 |
|
[sp] |
36 |
|||
7 |
7 |
|
H |
17 |
|
R |
27 |
|
$ |
37 |
|||
8 |
8 |
|
I |
18 |
|
S |
28 |
|
% |
38 |
|||
9 |
9 |
|
J |
19 |
|
T |
29 |
|
* |
3 |
編碼方式為:
源碼被分成兩個字符一段,如下所示,每段的第一個字符乘上45,再用第二個數字相加。因此每段變成了11bit的2進制碼,如果字符個數只有1個,則用6bit表示。
示例:
|
|
"AB" |
"CD" |
"E1" |
"23" |
|
|
45*10+11 |
45*12+13 |
45*14+1 |
45*2+3 |
|
|
461 |
553 |
631 |
93 |
0010 |
000001000 |
00111001101 |
01000101001 |
01001110111 |
00001011101 |
3、8bit字節數據不經編碼轉換直接保存。
5.5 編碼終止符(Terminator)
如果編碼後的字符長度不足當前版本和糾錯級別所存儲的容量,則在後續補"0000",如果容量已滿則無需添加終止符。此時得到的編碼串為:
0010 000001000 00111001101 01000101001 01001110111 00001011101 0000
5.6 編成8bit碼字(Code words)
將以上的編碼再按8bit一組,形成碼字(code words):
00100000 01000001 11001101 01000101 00101001 11011100 00101110 10000
如果尾部數據不足8bit,則在尾部充0:
00100000 01000001 11001101 01000101 00101001 11011100 00101110 10000000
如果編碼後的數據不足版本及糾錯級別的最大容量,則在尾部補充 "11101100" 和"00010001",直到全部填滿。最後,版本1、Level H下的"ABCDE123" 的QR碼是:
00100000 01000001 11001101 01000101 00101001 11011100 00101110 10000000 11101100
十進制表示法為:
32 65 205 69 41 220 46 128 236
QR碼編碼原理(日本漢字和中文編碼)
一、日本漢字(KANJI)是兩個字節表示的字符碼,編碼的方式是將其轉換為13字節的二進制碼制。
轉換步驟為:
1、對於JIS值為8140(hex) 到9FFC(hex)之間字符:
a)將待轉換的JIS值減去8140(hex);
b)將高位字節乘以C0(hex);
c)將b)步驟生成的數據加上低位字節;
d)將結果轉換為13位二進制串。
2、對於JIS值為E040(hex)到EBBF(hex)之間的字符:
a)將待轉換的JIS值減去C140(hex);
b)將高位字節乘以C0(hex);
c)將b)步驟生成的數據加上低位字節;
d)將結果轉換為13位二進制串。
二、中文漢字的與日文漢字轉換步驟相似:
1、對於第一字節為0xA1~0xAA之間,第二字節在0xA1~0xFE之間字符:
a)第一字節減去0xA1;
b)上一步結果乘以0x60;
c)第二字節減去0xA1;
d)將b)步驟的結果加上c步驟的結果;
e)將結果轉換為13位二進制串。
1、對於第一字節為0xB0~0xFA之間,第二字節在0xA1~0xFE之間字符:
a)第一字節減去0xA6;
b)上一步結果乘以0x60;
c)第二字節減去0xA1;
d)將b)步驟的結果加上c步驟的結果;
e)將結果轉換為13位二進制串。
【轉】二維碼生成原理