1. 程式人生 > >Tesseract-OCR 3.02命令列程式的使用

Tesseract-OCR 3.02命令列程式的使用

  OCR(Optical Character Recognition):光學字元識別,是指對圖片檔案中的文字進行分析識別,獲取的過程。最近因為需要看了看OCR的相關知識,這裡我看的是谷歌的Tesseract-OCR檢測引擎。Tesseract:開源的OCR識別引擎,初期Tesseract引擎由HP實驗室研發,後來貢獻給了開源軟體業,後經由Google進行改進,消除bug,優化,重新發布。當前版本為3.05.
  想要使用這個開源引擎,就要先將其原始碼編譯才行。這裡給出原始碼地址:Tesseract。這裡我們要說的是對於官方對VS2008平臺給出的一個可編譯的工程,其版本是3.02,同時官方還給出了一個可安裝的命令列執行程式,其地址在

tesseract-ocr-setup-3.02.02.exe。下載好是可以直接安裝的,其安裝介面如下。
  1
  按裝時候會有一個Tesseract development files 的選項,如果勾選的話,在安裝時會自動下載相關的開發檔案。但是,由於谷歌在天朝的情況,所以我這裡是連線不上的,大家安的時候可以不選,如果有啥要用的到時在去官網那下載就好了。由於安裝時程式已將路徑加入環境變數:
2

  所以大家在命令提示窗直接執行就好,在命令窗輸入tesseract如果出現下面結果就說明安裝正確:
  3
  這其實就列出了Tesseract3.02的功能選項,出現這樣的輸出就說明程式安裝正確,下面就試驗一下最基本的字元識別功能,因為我這裡沒有下載其他的中文字型檔,所以就識別一下下圖中的英文就好:
  4


  圖片我放在D盤。所以先把當前路徑換到D盤:>D:就行然後如入識別指令,其格式是:
  >tesseract imagemane outputname
imagemane是圖片名字, outputname是輸出檔名字,以.txt檔案形式儲存。比如,這裡我們測試圖片名字是test.png,然後命令為:tesseract test.png test 如下圖:
5
這樣就識別成功了,然後早D盤下會有一個test.txt,開啟後就可以看到檢測結果了:
8
9
這就是Tesseract-ocr 3.02命令列的基本使用過程。

  雖然可以直接使用,但是版本太低,且沒發讓開發者去DIY,所以下次我會寫一下怎麼對最新原始碼進行編譯,得到Tesseract的庫檔案。