1. 程式人生 > >漢字常用特徵的提取方法詳解

漢字常用特徵的提取方法詳解

CSDN的部落格確實太難寫編輯了,最常用的還是WORD,我是從word導過來,圖片什麼的重新插入的,麻煩死了。所以排版什麼的可能有點不規則,見諒。

漢字模板製作:

漢字模板即是對字模圖片進行特徵提取,將特徵資料存放到儲存器上構成模板。模板製作與提取待識別漢字特徵需要將原始漢字圖片進行歸一化,可增加特徵的魯棒性。漢字資料尺度歸一化到為64*64,歸一化方法很多,最常用的是基於重心的歸一化,不做詳細介紹。

網格特徵:

       在實際中,為了增加特徵的魯棒性,常常採用網格技術。即統計漢字某一區域內特徵的總和,這樣可以削弱區域性干擾。網格結構主要是等分網格和彈性網格。等分網格即是把原影象按尺寸平均分割為若干小網格,彈性網格則根據筆畫密度劃分原始影象

。彈性網格對字元位置偏移、扭曲更加不敏感,是目前使用最多的網格結構,考慮到 “一” “l”等極端過窄字元,限制彈性網格彈力範圍。


漢字的網格特徵:

漢字常用特徵有:粗外圍特徵、外輪廓特徵、內輪廓特徵、方向線素特徵。其中粗外圍、外輪廓用於粗分類,外輪廓、內輪廓、方向線素用於細分類。

1)粗外圍特徵

       該特徵用於描述漢字較粗糙的結構資訊。

首先對原漢字進行細化處理,得到漢字的骨架影象。常用的影象細化演算法均可,推薦使用R方法其速度較快。R演算法的一個連結:http://download.csdn.net/detail/jy02660221/9584580

             

原影象與骨架影象

首先對骨架影象進行內部區域填充處理。若該點為白色(非筆畫區域),則檢測其上下左右四個方向是否有筆畫,若都有筆畫則認為該點為內部區域,將白色置為黑色,依次處理完所有白點。然後將填充圖分成4*4共16個小塊,統計每一小塊黑色點數(筆畫)數量,構成16維粗外圍特徵。特徵提取示意如下。


填充圖及粗外圍特徵

2)外輪廓特徵

該特徵用於描述漢字外部輪廓資訊。 原漢字二值影象沿上下左右 4個方向進行掃描。為了提高對字元形變的魯棒性,本文用彈性網格對掃描區域進行劃分,統計該部分第一次碰到筆畫的面積。如下圖(箭頭表示的掃描方向) ,每個方向被分為了 4 個區域,每個區域陰影面積即是 1維特徵。那麼經該處理後,得到 4*4=16 維特徵。


3)內輪廓特徵

   該特徵用於描述漢字內部結構資訊。對漢字細化後的骨架影象沿上下左右4個方向掃描,掃描方式同外輪廓特徵提取,統計第一次穿過筆畫與第二次再次碰到筆畫之間的面積(下圖 陰影部分,箭頭表示掃描方向)。該特徵描述了漢字更加細節的內部結構,特徵維度為 16維。


4)方向線素特徵

       1.該特徵用於描述漢字較細膩的筆畫結構資訊。對漢字原影象進行一階微分運算,得到漢字的外部輪廓線影象,如下所示。


原影象與外輪廓線影象

2.把外輪廓線影象分成8*8=64個區域,統計每個小塊中有效畫素(筆畫)的方向線素累積和。計算每個畫素的方向線素:在區域性區域裡(3X3區域),計算中心畫素的方向向量。該向量是4維特徵,對應“橫、豎、撇、捺”4個方向。即在4個方向基礎上,對輪廓做順時針跟蹤,將每個方向又分成2個指向,例如:“橫”可以分成“左向橫”和“右向橫”。在3X3鄰域裡包圍中心點的8個畫素可以產生256種組合,採用查表的方式分別給方向向量的4個元素賦值,如下表(表中數值僅為示意,具體比例係數以程式為準)。這樣共構成8*8*4=256維特徵。


這裡我們介紹了4種漢字常用特徵,其中方向線素特徵與梯度方向直方圖很類似,可用梯度方向直方圖替代,產生更精細的效果。