1. 程式人生 > >創藍萬數平臺圖像識別OCR技術

創藍萬數平臺圖像識別OCR技術

ocr文字識別 智能 src ffffff 對比 之前 字體大小 提高 文本

圖像識別OCR,廣泛用於識別各種證件、卡類、甚至發票和單據,快速把圖片信息轉換成文本信息;主要用於解決快速卡證類的信息輸入,以及卡證的接口調用查詢;
目前支持API的方式調用,圖片支持Base64編碼以及圖片Url兩種方式,目前支持的格式有:jpg、png、bmp三種格式,建議文件大小在2M以內。

一.技術實現流程:
技術分享圖片

二. 圖像矯正技術:

之前對於OCR文字識別的圖像要求非常高,不僅需要分辨率高,而且還需要比較正,歪斜或者對焦不準照成的模糊和光影都會對識別的準確率造成非常大的影響。我們通過對拍攝圖片的智能檢測自動拉伸、矯正、增強對比,只為提高OCR的識別率。

技術分享圖片
原圖
技術分享圖片
矯正
技術分享圖片
增強對比識別

三.基於AI深度學習的版面分析技術

我們通過數百萬的照片識別學習,智能糾錯識別在各種幹擾環境中的準確識別,大大提高OCR識別的準確率。
技術分享圖片
四. 基於各種證件的特定漢字形態優化算法:
各種證件五花八門,字體大小形態也是各異,我們針對每一類證件進行特定優化識別,精確化的文字的字體、版面布局、文字比例大小等,進一步提高OCR識別的精度與準度。
技術分享圖片

五.全角度識別無壓力
技術分享圖片
正著拍,倒著拍,翻著拍,想怎麽拍就怎麽拍,我們都能準確無誤的識別。
輸出示例:
技術分享圖片
技術分享圖片

創藍萬數平臺圖像識別OCR技術