1. 程式人生 > >增值稅發票掃描識別

增值稅發票掃描識別

核心關鍵詞:文字識別、票據識別、資料捕獲、OCR、事後監督、事中監督

文通銀行票據識別引擎是針對銀行巨大的票據業務,使用票據OCR技術提取票據影像上的關鍵欄位要素,自動建立索引,從而完成金融領域風險監督、票據自動存檔。銀行票據識別引擎(SDK)由兩部份組成:模板編輯器和分類識別核心。其中模板編輯器完成票據模板的規則定製工作,並由識別模板指導識別核心進行影像分類和識別。

工作原理如下圖:

1.1 模板編輯器 文通銀行票據識別系統提供了便捷的模板製作工具——模板編輯器。模板為識別過程提供指導,包括分類標識、定位標識、識別要素等詳細資訊。分類標識資訊包括:影象大小、版面特徵檔案、框線資訊、標題資訊、文字資訊等多種分類資訊。在識別過程中具體採用的分類演算法可以通過模板編輯器在主模板中配置。

1.2 影象預處理模組 文通銀行票據識別系統在對影像進行識別前做了多項預處理操作,為之後識別輸出最優的影象質量,具體有糾偏、偏色校正、濾色、降噪、二值化、增強識別單元對比度等功能。這些預處理功能均可通過引數靈活配置、自由組合。

1.3 票據分類模組 文通銀行票據識別系統票據分類功能強大:系統同時支援表格框線(位置、顏色)分類、標題單元(標題內容、標題顏色)分類、文字區域(文字內容、文字顏色)分類等,以限度發掘不同憑證之間的差異。如框線顏色、標題顏色均可以用來區分多聯憑證的不同聯;文字內容可以區分同一憑證列印多種交易的影像;文字顏色可以用來區分同一種憑證分多聯並且不同聯之間框線顏色和標題顏色均相同的影像。

1.4 字元識別核心模組 系統支援印刷漢字識別、印刷英文識別、印刷數字識別、手寫漢字識別、手寫英文識別、手寫數字識別、磁碼識別、條形碼識別、客戶簽字檢測、附件章檢測等多個識別引擎。

2. 我們的技術服務 我們的宗旨:為客戶提供企業級的資料採集技術

我們的技術服務內容:

1、識別需求評估;

2、二次開發技術支援,在企事業客戶開發應用系統的過程中,我們將全程跟蹤,為客戶方提供專業團隊的技術服務;

3、持續的軟體升級服務;