1. 程式人生 > >二維碼的生成與識別

二維碼的生成與識別

部分 編碼規則 信息 包括 復雜 class 選擇題 http url

二維碼的生成與識別

大學最後一次課程設計,居然是數字圖像處理。可以想象有多為難,對於一個普通的二本學生來說,這無疑是一個挑戰。好在老師對我們放低了要求,可以站在巨人的肩膀上,可以從網上down別人的代碼,但是一定要弄懂。我們組選擇題目的是二維碼的生成與識別。完成這個課設才發現平常生活中隨處可見的二維碼居然這麽復雜。果然不了解就沒有發言權啊。

下面我就把我總結的關於二維碼的相關知識點分享一下。

二維碼

二維碼又稱QR Code,QR全稱Quick Response,是一個近幾年來移動設備上超流行的一種編碼方式,它比傳統的Bar Code條形碼能存更多的信息,也能表示更多的數據類型。

二維條碼/二維碼(2-dimensional bar code)是用某種特定的幾何圖形按一定規律在平面(二維方向上)分布的黑白相間的圖形記錄數據符號信息的;在代碼編制上巧妙地利用構成計算機內部邏輯基礎的“0”、“1”比特流的概念,使用若幹個與二進制相對應的幾何形體來表示文字數值信息,通過圖象輸入設備或光電掃描設備自動識讀以實現信息自動處理:它具有條碼技術的一些共性:每種碼制有其特定的字符集;每個字符占有一定的寬度;具有一定的校驗功能等。同時還具有對不同行的信息自動識別功能、及處理圖形旋轉變化點。

二維碼的結構

1、版本信息:version1(21*21),version2,...,version40,一共40個版本。版本代表每行有多少模塊,每一個版本比前一個版本增加4個碼元,計算公式為(n-1)*4+21,每個碼元存儲一個二進制0或者 1。1代表黑色,0表示白色。比如,version1表示每一行有21個碼元。

2、格式信息:存儲容錯級別L(7%),M(15%),Q(25%),R(35%)。容錯:允許存儲的二維碼信息出現重復部分,級別越高,重復信息所占比例越高。目的:即使二維碼被圖標遮住一部分,一樣可以獲取全部二維碼內容。有圖片的二維碼, 圖片不算二維碼的一部分,它遮住一部分碼元,但還是可以掃描到所有內容。

3、碼字:實際保存的二維碼信息,和糾錯碼字(用於修正二維碼損壞帶來的錯誤,就是說當碼元被圖片遮住,可以通過糾錯碼字來找回)。

4、位置探測圖形、位置探測圖形分隔符、定位圖形,校正圖形:用於對二維碼的定位。位置探測圖形用於標記矩形大小,3個圖形確定一個矩形。定位符是因為二維碼有40個版本尺寸,當尺寸過大後需要有根標準線,不然掃描的時候可能會掃歪。

具體的二維碼結構如圖1-1所示。

技術分享

圖:1-1二維碼結構示意圖

二維碼的生成過程

信息按照一定的編碼規則後變成二進制,通過黑白色形成矩形。

  1. 數據分析:確定編碼的字符類型,按相應的字符集轉換成符號字符; 選擇糾錯等級,在規格一定的條件下,糾錯等級越高其真實數據的容量越小。

格式

容量

數字

最多7089字符

字母

最多4296字符

二進制數(8 bit)

最多2953字節

日文漢字/片假名

最多1817字符(采用Shift JIS)

中文漢字

最多984字符(采用UTF-8)

中文漢字

最多1800字符(采用BIG5)

  1. 數據編碼:將數據字符轉換為位流,每8位一個碼字,整體構成一個數據的碼字序列。其實知道這個數據碼字序列就知道了二維碼的數據內容。
  2. 糾錯編碼:按需要將上面的碼字序列分塊,並根據糾錯等級和分塊的碼字,產生糾錯碼字,並把糾錯碼字加入到數據碼字序列後面,成為一個新的序列。

糾錯等級

糾錯水平

L

7%字碼修正

M

15%字碼修正

Q

25%字碼修正

H

30%字碼修正

在二維碼規格和糾錯等級確定的情況下,其實它所能容納的碼字總數和糾錯碼字數也就確定了,比如:版本10,糾錯等級時H時,總共能容納346個碼字,其中224個糾錯碼字。就是說二維碼區域中大約1/3的碼字時冗余的。對於這224個糾錯碼字,它能夠糾正112個替代錯誤(如黑白顛倒)或者224個據讀錯誤(無法讀到或者無法譯碼),這樣糾錯容量為:112/346=32.4%。

4.構造最終數據信息:在規格確定的條件下,將上面產生的序列按次序放如分塊中。按規定把數據分塊,然後對每一塊進行計算,得出相應的糾錯碼字區塊,把糾錯碼字區塊 按順序構成一個序列,添加到原先的數據碼字序列後面。

5.構造矩陣:將探測圖形、分隔符、定位圖形、校正圖形和碼字模塊放入矩陣中。

6.掩摸:將掩摸圖形用於符號的編碼區域,使得二維碼圖形中的深色和淺色(黑色和白色)區域能夠比率最優的分布。

7.格式和版本信息:生成格式和版本信息放入相應區域內。

二維碼的識別

1、定位圖形:首先尋找探測圖形,就是二維碼上的三個方塊。這三個方塊的作用就是不管在哪個方向掃描圖形,都可以掃到,不信可以將手機翻轉測試一下。在通過二維碼上的定位圖形和分隔符確定二維碼信息的圖像。定位圖形確定二維碼符號中模塊的坐標,二維碼中的模塊都是固定的,包括校正圖形,版本信息,數據和糾錯碼。分隔符呢,就是將探測圖形與二維碼信息圖像分開。

2、灰度化二維碼信息像素:手機拍到的圖像都是彩色的,所以拍攝到二維碼也不列外,它也是彩色的,只不過除了黑白,其他顏色非常淺而已。灰度化是指通過顏色的深淺來識別二維碼,就是說顏色深的按深灰處理,淺色的按淺灰處理,去掉其他顏色。
3、去掉二維碼信息像素的噪點:相機的傳感器在把光線作為接收信號和輸出過程產生的粗糙像素,這些粗糙的像素是照片中不應該出現的幹擾因素。噪點就是指這些粗糙的像素。

4、二值化二維碼信息像素:二值化是說將圖像上像素灰度值設置為0或者255,也就是變成只有黑白兩種顏色。第一步已經灰度化變成只有深灰和淺灰兩種顏色,現在二值化是將深灰變成黑色,淺灰變成白色。為什麽變成黑白色呢。因為二維碼圖像其實是由二進制的0或者1組成,0代表白色,1代表黑色。二維碼在二值化時會將二維碼圖像變成只有黑白色的條碼,然後根據解析公式什麽的(因為像素是0-255之間,要全部轉變成0或者255,估計得經過一些計算,然後0就是0,255變為1)轉化成二進制信息。

5、二維碼譯碼和糾錯:將得到的二進制信息進行譯碼和糾錯。得到的二進制信息是版本格式信息、數據和糾錯碼經過一定的編碼方式生成的,所以譯碼是對版本格式信息,數據和糾錯碼進行解碼和對比。糾錯是和譯碼同時進行的,將數據進行糾錯。得到數據

二維碼的生成與識別