1. 程式人生 > >把掃描檔案轉變為word文件的最實用的四款OCR識別軟體

把掃描檔案轉變為word文件的最實用的四款OCR識別軟體

漢王 OCR 6.0 特別版
在最近幾年中,OCR識別技術隨著掃描器的普及得到了飛速的發展,掃描、識別軟體的效能不斷強大並向智慧化不斷升級發展。
      OCR是英文Optical Character Recognition的縮寫,意思為光學字元識別,通稱為文字識別,它的工作原理為通過掃描器或數碼相機等光學輸入裝置獲取紙張上的文字圖片資訊,利用各種模式識別演算法分析文字形態特徵,判斷出漢字的標準編碼,並按通用格式儲存在文字檔案中,由此可以看出,OCR實際上是讓計算機認字,實現文字自動輸入。它是一種快捷、省力、高效的文字輸入方法。

        漢王OCR 是針對機關單位、企業及有文字錄入需求的個人使用者,在日常的工作中,快速的對書刊、報紙、公文、宣傳頁等印刷稿件中內容進行錄入的應用需求而推出的。本產品集成了漢王科技頂尖的文字識別技術,對印刷文稿錄入的識別率高達99.5%,能夠識別百餘種印刷字型和各種中英繁表圖混排格式的文字,。是理想的文字、表格、影象錄入系統。
       這樣一來,就不用再手工輸入大量的資料了,只要掃進去,像那種抓英文的工具一樣,讓軟體自動地轉成WORD文件。即可將圖片變成可編輯的文擋格式。這是目前破解最完美的漢王OCR

軟體。
http://down.x6x8.com/soft/6/64/245.html




QUOTE:
丹青中英日文OCR辯識 白金版 4.5

安裝序列號:MXRD450-7DMN-MM7M-CFCB
功能簡介
原文重現 盡在瞬間
◎提供繁中、簡中和日文三種操作介面
◎可辨識繁中、簡中、英文及日文四種檔案
◎辨識後的檔案可儲存成各種常用檔案格式再編輯
◎超高辨識速率及辨識率再提升,快速原文重現各式檔案
產品說明
影像掃瞄
1. 可處理彩色、灰階或黑白的檔案影像。
2. 傾斜校正:自動偵測檔案影像傾斜角度,並提供旋轉影像之功能。
辨識檔案
< 檔案分析及辨識 >
1. 自動辨識:輕按一鈕,即可自動分析、辨識、校對影像檔案,圖文分離,並轉換成可編輯的檔案檔案。
2. 設定辨識字集:不需切換語文環境,即可辨識繁中、簡中、純英文及日文四種檔案。
3. 高辨識速率:在Pentium III 667MHz個人電腦環境下,每秒鐘能辨識高達150箇中文字。
4. 多種字型辨識及重現:能夠辨識多種印刷字型,如明體、黑體、仿宋體、楷書、圓體、隸書等,並在辨識後還原成原稿的字型。
5. 原文重現編輯環境:可辨識各種表格及影像,辨識結果依照原檔案的圖文版面格式呈現,方便您校對、編輯,節省重新排版的時間。
< 自動校對與學習 >
1. 再辨識功能:提供合/分字、合/分行、合/分割槽塊、變更區塊屬性等再辨識功能,讓您能夠修正錯誤的辨識結果。
2. 學習新字功能:可將易辨識錯誤的字元輸入到學習資料庫中,提高下次辨識之正確率。
3. 候選字功能:提供原文影像供辨識後圖文作校對,且針對型態相近之文字及語意上前後相連的字詞提供候選字輕鬆更正辨識錯誤的文字。
4. 自動校對:利用內建的常用詞庫自動校對辨識出的文字,並標示出辨識時所碰到的疑問字,節省您校對的時間。
輸出檔案
1. 傳送至其他應用軟體:可將辨識結果直接傳送至您所指定的應用軟體中再處理,例如可設定辨識結果自動儲存成HTML檔案並直接傳送至網路瀏覽器中。
2. 可儲存多種檔案格式:辨識後的結果可儲存成不同之檔案格式,如TXT、RTF、DOC、XLS、SLK、CSV、HTML等,方便您做不同的應用與處理。
http://down.x6x8.com/soft/6/64/248.html




QUOTE:
清華紫光文通 TH-OCR 9.0 光碟完全特別版

把破解補丁放到安裝目錄下,執行破解補丁,確定,OK!
TH-OCR簡介
  OCR是英文Optical Character Recognition的縮寫,意思為光學字元識別,通稱為文字識別,它的工作原理為通過掃描器或數碼相機等光學輸入裝置獲取紙張上的文字圖片資訊,利用各種模式識別演算法分析文字形態特徵,判斷出漢字的標準編碼,並按通用格式儲存在文字檔案中,由此可以看出,OCR實際上是讓計算機認字,實現文字自動輸入。它是一種快捷、省力、高效的文字輸入方法。

  TH-OCR是清華大學自1985年就開始研發的,TH是TsingHua(清華)的縮寫,TH-OCR代表北京清華紫光文通資訊科技有限公司開發的OCR
軟體。在國家“863”計劃支援下,持續了十多年的科研成果,從1.0版本開始已經升級到現在的9.0版本。獨家真正實現了漢英混排同時識別,在國際上首次突破了OCR產品只能處理漢字或英文單一文字的侷限性,新增了東方文字(簡繁漢、日文、韓文)識別功能,對日文和韓文與英文混排文件的識別水平甚至超過日本和韓國對本國文字的識別水平,在國內、外產生了重大的影響,並連續3年被中國軟體行業協會評為優秀軟體產品,成為漢字輸入技術的一座里程碑。TH-OCR9.0版本已應用到了包括電子政務、電子出版物、報社、銀行、郵政、稅務、圖書館等多個領域,成為國內OCR市場的先鋒。

  本屆兩會代表的所有提案全部採用了我國自主智慧財產權的世界識別領域領先產品——清華紫光文通的TH-OCR9.0進行錄入識別,它以準確的識別率、優異的識別速度博得了兩會工作人員的交口稱讚。而清華TH-OCR技術在兩會上的成功應用更論證了我國也完全有實力擁有自己的卓越技術。

TH-OCR的突出特點:
◇ 漢英雙語同時混排,識別率最高,居世界領先水平。  
◇ 可以識別黑白、灰度、彩色影象,可以讀取多種影象格式。
◇ 首創對識別結果進行電子文件版面復原功能,所見即所得。
◇ 首創日文、韓文、日英混排、韓英混排識別功能,識別率98%以上。

TH-OCR的六大優勢:

1. 是唯一可以識別2萬多漢字的多體文字識別系統,漢字識別國內最優。

2. 漢字和英文混排、日文和英文混排、韓文和英文混排同時識別。

3. 漢字識別率最高。清華紫光文通TH-OCR經過"863"智慧專家組對數十萬字的指標評測和中國軟體評測中心對產品的嚴格測試,識別正確率超過99.5%,代表了目前印刷體文字識別的最高水平。

4. 支援多種環境介面。清華紫光文通TH-OCR支援WINDOWS環境和GB、BIG5、GBK、JIS、 SHIFT-JIS和KSC等多種內碼,可以用於 WINDOWS NT和WINDOWS 98/2000/XP,適合全球各個地區使用。TH-OCR還具有自學習功能,不論什麼生僻字,都可以通過鍵盤輸入進行學習,大大拓寬了OCR系統的識別字符集。

5. 歷次國內鑑定均被中國科學院院土和中國工程院院土等專家組成的鑑定委員會評定為“具有世界領先水平”。

廣泛的社會認可:

1、 多年來為眾多著名的掃描器廠商HP、UNISCAN、EPSON、CANON、 LENOVO等提供TH-OCR普及版作為其掃描器的捆綁軟體。

2、美國MICROSOFT公司將TH-OCR作為東方文字識別捆綁到WINXP 作業系統中。

3、美國MOTOROLA公司確定TH-OCR的部分技術使用權。

4、美國INTEL公司確定TH-OCR為最新的MMX技術支援專案。

5、《計算機世界》市場調查結果,清華紫光文通TH-OCR市場佔有率達65%以上。

6、《中國計算機報》 CIWLAB組織的使用者調查認為, TH-OCR是一個性能極好的系統,是一個值得使用者信賴的系統(對其他品牌OCR評價為:“是值得使用者選擇的產品”)。
http://down.x6x8.com/soft/6/64/247.html




QUOTE:
尚書7號OCR文字識別系統完全版 Shocr7.0

本軟體系統是應用OCR(Optical Character Recognition)技術,為滿足書籍、報刊雜誌、報

表票據、公文件案等錄入需求而設計的軟體系統。目前,許多資訊資料需要轉化成電子文件以

便於各種應用及管理,但因資訊數字化處理的方式落後,不但費時費力,而且資金耗費巨大,

造成了大量文件資料的積壓,因此急需一種快速高效的軟體系統來滿足這種海量錄入需求。本

軟體系統正是適用於個人、小型圖書館、小型檔案館、小型企業進行大規模文件輸入、圖書翻

印、大量資料電子化的軟體系統。
●識別字符
簡體字符集:國標GB2312-80的全部一、二級漢字6800多個。
純英文字符集。
簡繁字集:除了簡體漢字外,還可以混識臺灣繁體字5400多個以及香港繁體字和GBK漢字。
●識別字體種類
能識別宋體、仿宋、楷、黑、魏碑、隸書、圓體、行楷等一百多種字型,並支援多種字型混排


● 識別字號
初號 小六號字型。
●表格識別
可以自動判斷、拆分、識別和還原各種通用型印刷體表格。
●可支援繁體WINDOWS系統
首先,尚書七號開始將整個OCR的過程,明確化了,通過程式的選單,我們就能夠知道整個OCR

的過程,主要分為:“檔案”、“編輯”、“識別”、“輸出”等步驟。
在檔案選單中,您可以呼叫掃描器,或者選擇將已經掃描好的影象檔案開啟。得到影象檔案後

,使用者開始的工作,就是“編輯“選單裡面所提示的:影象頁面的處理,其中包括影象頁的傾

斜校正(提供自動和手動實現方法),旋轉等功能。
處理完畢後,就可以進入“識別過程”,該過程關鍵的是“版面分析”,現在尚書七號的自動

版面分析功能很強,面對報紙雜誌等複雜情況的版面,也是分析的正確率很高。不再需要我們

在尚書六號裡面那樣的建議手工劃識別範圍。也正是這點,大大降低了使用者的工作量。為了

方便,“識別”選單下,也提供了使用者自己在自動版面分析後,通過修改識別範圍框的屬性,

來決定需要識別否的功能(預設的情況下,圖象屬性的欄目是不用識別的。當然,如果使用者還

是習慣原來尚書六號那樣,自己來設定識別區域,只要直接用滑鼠劃框就可以了。接下來,用

戶就可以直接選擇“開始識別”的按鈕了,等待識別的結果。
http://down.x6x8.com/soft/6/64/246.html