1. 程式人生 > >OCR 常用軟體對比

OCR 常用軟體對比

國內主要OCR廠商產品的介紹

1、文通(http://www.wintone.com.cn/a/prods/netocr/)

北京文通科技有限公司是享譽國內外的OCR(光學字元識別)技術生產商、文件影像技術和應用解決方案提供商。經過多年的創新與發展,文通科技現已成長為國內知名的高新技術企業,在全國十餘個城市建立了分支機構,公司產品涉及多個領域。 演示地址:http://cloud.wintone.com.cn/   2、百度(http://apistore.baidu.com/apiworks/servicedetail/969.html) 演示地址:http://apistore.baidu.com/astore/toolshttpproxy?apiId=usu9zg&isAworks=1   3、靈雲(http://www.hcicloud.com/) 靈雲作為第一個開放的人工智慧雲服務平臺,將智慧語音互動、影象識別、語義理解、機器翻譯、生物特徵識別等人工智慧技術完美整合。使用者可通過移動互 聯網、網際網路,使用任何裝置,在任何時間、任何地點,隨時隨地享受靈雲提供的“聽、說、讀、寫、意……”等全方位的人工智慧技術服務。目前,靈雲以“雲 + 端”的方式,通過靈雲開發者社群為開發者提供語音合成(TTS)、語音識別(ASR)、手寫識別(HWR)、光學字元識別(OCR)、機器翻譯(MT)、 語義理解(NLU)、聲紋識別(VPR)等多項人工智慧核心技術能力服務。 演示地址:http://www.hcicloud.com/products/show/forward/ocr   4、微軟 微軟的牛津計劃中的一部分,對中文支援不怎麼好。 其中的人臉檢測,人臉識別,語音識別,目標檢測,場景理解,OCR(特別是英文)都做得很不錯。 演示地址:https://www.projectoxford.ai/demo/visions#Ocr   5、雲脈科技(http://www.yunmai.cn/) 廈門雲脈技術有限公司(原廈門思根科技有限公司),我司成立於2002年6月,總部位於環境優美,宜人宜居的廈門,是廈門最大的一家手機軟體研發公 司。雲脈技術在手機拍照文字識別、名片識別、手機資訊網路/PC同步及管理技術方面處於領先地位,與100多家手機廠商、電信運營商、PC外接裝置製造 商、行業專案系統整合商及各大網際網路公司建立了深厚的合作關係。公司憑藉先進的技術實力與良好的客戶關係,今後將以OCR識別引擎SDK合作、為各行業提 供移動辦公資訊化管理及移動電子商務解決方案作為公司下一階段研發和運營的戰略重點。 這家公司有手機版的車牌識別 演示地址:http://www.yunmai.cn/?viewnews-165.html   6、還有老毛子的公司ABBYYFineReader。號稱OCR中的賓士,現在不知道如何了,是否被其他公司超越了呢。   7、漢王(http://www.hw99.com/) 國內的老牌子了,以前和文通都是OCR的領頭羊,現在很多新公司在慢慢的超越他們了。漢王也提供了雲服務,名片,身份證,人臉都包含進去了 演示地址:http://developer.hanvon.com/card/toCard.do   這裡有一個帖子,對國內外產品進行了討論比較: http://www.zhihu.com/question/19593313  

真正能把中文OCR做得比較專業的,一共也沒幾家,國內2家,國外2家。國內是文通和漢王,國外是ABBYY和IRIS(臺灣原來有2家丹青和蒙恬,這兩年沒什麼動靜了)。像大家提到的紫光OCR、CAJViewer、MS Office、清華OCR、包括慧視小靈鼠,這些都是文通的產品或者使用文通的識別引擎,尚書則是漢王的產品,和中晶掃描器捆綁銷售的。這兩家的中文識別率都是非常不錯的。而國外的2家,主要特點是西方語言的識別率很好,而且支援多種西歐語言,產品化程度也很高,不過中文方面速度和識別率還是有差距的,當然這兩年人家也是在不斷進步。Google的開源專案(Tesseract ),至少在中文方面,和這些家相比,各項效能指標水平差距還蠻大的呢

光學字元識別(OCR)軟體比較

名稱 支援平臺 程式語言 字型語言 輸出格式 備註
Tesseract Windows/MacOSX /Linux C++, C 40+ 文字,hOCR,其他 開源,支援中文
ExperVisionTypeReader

Windows/MacOSX /Linux

C/C++ 21 hOCR 多次獲獎;不支援中文
Windows/MacOSX /Linux C/C++ 198 DOC, DOCX, XLS, XLSX, PPTX, RTF, PDF, HTML, CSV, TXT, ODT, DjVu, EPUB, FB2 世界排名第一;識別精度達99%;
Windows/MacOSX /Linux C/C++, .NET, Objective-C, Java, JavaScript 56 PDF, PDF/A, DOC, DOCX, XLS, XPS, RTF, HTML, ANSI Text, Unicode Text, CSV 支援拉丁語, 亞洲語言,阿拉伯語,MICR字符集;支援整頁或者部分割槽域的OCR識別;
CuneiForm/OpenOCR Windows/MacOSX /Linux C/C++ 28 ? 企業級系統,可以儲存文字格式,並識別結構的複雜表格
Image to OCR Converter Windows C/C++, VB , .NET 40 PDF, Word, HTML, Text 讀取的影象格式和PDF檔案,並可以從照相機掃描影象
Windows C/C++ 40+ PDF, TXT -
Puma.NET Windows C# 28 ? -