1. 程式人生 > >ubuntu下tesseract 4.0安裝及引數使用

ubuntu下tesseract 4.0安裝及引數使用

tesseract是一個開源的OCR引擎,最初是由惠普公司開發用來作為其平板掃描器的OCR引擎,2005年惠普將其開源出來,之後google接手負責維護。目前穩定的版本是3.0。4.0版本加入了基於LSTM的神經網路技術,中文字元識別準確率有所提高。

ubuntu下tesseract 4.0安裝:

終端輸入以下命令:

sudo add-apt-repository ppa:alex-p/tesseract-ocr

sudo apt-get update 


sudo apt-get install tesseract-ocr 

測試安裝是否成功,同時檢查版本:

tesseract --version 



字型檔下載



下載完成之後把.traineddata字型檔檔案放到tessdata目錄下,預設路徑是/usr/share/tesseract-ocr /4.0/tessdata


中文OCR識別測試

在終端中使用tesseract格式:

tesseract xx.jpg result --psm 7

執行之後生成結果記錄在result裡,--psm 7 指令表示內容是一行文字
更多tesseract使用指令可以檢視help

tesseract --help


檢視已安裝字型檔

tesseract --list-langs


--psm命令
psm命令指明文字的模式,預設為3:



--oem命令

定義OCR引擎的模式:



相關推薦

ubuntutesseract 4.0安裝引數使用

tesseract是一個開源的OCR引擎,最初是由惠普公司開發用來作為其平板掃描器的OCR引擎,2005年惠普將其開源出來,之後google接手負責維護。目前穩定的版本是3.0。4.0版本加入了基

linux ubuntu mongodb 4.0 安裝和配置遠端連線

安裝 搬運: 安裝教程 選擇對應版本,複製貼上命令即可,這裡就不涉及了。 安裝完成後啟動服務:sudo service mongod start 如果提示Unit mon

UbuntuAndroid NDK的安裝配置

https://blog.csdn.net/davebobo/article/details/52446986 Android中IDE、ADT、SDK、JDK、NDK的解釋 1. IDE:Intelligent Development Environm的簡稱。即智慧開發環境。是一種開發工具。

ubuntu多版本opencv安裝切換

https://blog.csdn.net/qq_34952119/article/details/71501652 https://blog.csdn.net/learning_tortosie/article/details/80594399 https://opencv.org/rel

Ubuntuffmpeg-4.0編譯android所需的so庫

網上教程很多,之前編譯過,現在時間比較充裕,重新編譯下,我這也是參考了很多地方,簡單記錄下 (之前配置過環境,如ndk等,這裡就不寫了) 1.下載、解壓ffmpeg-4.0 wget https://f

CentOSSolr7.4.0安裝部署到Tomcat最全詳細教程

前言 作業系統:CentOS6.9 64位 Solr版本:Solr7.4.0 Tomcat版本:apache-tomcat-8.5.4 之前一直用Solr6,其實Solr7部署下來和Solr6是一樣的。 部署 第一步:下載安裝包 下載Solr7.4.0: w

Flume-ng-1.4.0安裝執行遇到問題總結

2、解壓安裝包     tar -zxvf apache-flume-1.4.0-bin.tar.gz 3、配置環境變數 export FLUME_HOME=/root/install/apache-flume-1.4.0-bin export PATH=$PATH:$F

python tesseract 4.0 安裝踩過的坑(基於macOS )

“Please make sure the TESSDATA_PREFIX environment variable is set to your “tessdata” directory” 這是因為沒有將tesseract/tesserdata加入到環境變數

ubuntu )tensorflow 的安裝版本升級

對於 CPU 版本 pip3 install –upgrade tensorflow 對於 GPU 版本: pip3 install –upgrade tensorflow-gpu

Ubuntu 一些庫的安裝資源

1.  生成三維點雲需要用到 pcl ,ubuntu下安裝方式點選開啟連結sudo add-apt-repository ppa:v-launchpad-jochen-sprickerhof-de/pcl sudo apt-get update sudo apt-get in

windows hadoop2.4.0 eclipse 外掛安裝配置

一、環境說明 hadoop 版本:2.4.0 hadoop 安裝環境:centos6 centos主機IP地址:192.168.0.207 eclipse版本:Luna eclipse 安裝環境:windows10

Ubuntu的opencv3.1.0安裝contrib庫的安裝+eclipse環境配置

1、基本情況: Ubuntu 14.04 系統下; eclipse編譯器; 安裝並配置opencv3.1.0及其contrib庫 2.安裝流程: (1)安裝依賴包: sudo apt-get install build-essential sudo apt-get install cma

安裝MongoDB最新版4.0配置和啟動實例

logs 默認端口 info mkdir -p 其他 gem nosql數據庫 eml pytho MongoDB簡介: 1.MongoDB是一款基於分布式文件存儲的開源的文檔數據庫,並且是業內領先的NoSQL數據庫,用C++編寫而成。2.在高負載的情況下,添加更多的節點,

Opencv 2.4.9在Ubuntu的配置與安裝

一、依賴包安裝        1.  build-essential 軟體包,為編譯程式提供必需軟體包的列表資訊,這樣軟體包才知道標頭檔案、庫函式在哪裡。還會下載依賴的軟體包,安裝gcc/g++/gdb/make 等基本程式設計工具,最後才組成一個開發環境。 sudo a

Source Insight 4.0安裝破解簡單使用

一、安裝與破解 1、下載Source Insight 4.0安裝包    https://www.sourceinsight.com/download/ 2、下載程式破解補丁包  https://pan.baidu.com/s/1irvH-K

Ubuntu16.0.4 Nginx安裝學習記錄(待補充)

Nginx安裝 sudo apt-get install nginx -y 檢視Nginx程序是否已經啟動 ps aux|grep nginx 出現類似如下內容,說明啟動成功可以訪問127.0.0.1檢視。 root 11554 0.0 0.0 45

Centos7 編譯安裝redis-4.0.1主從+哨兵模式

一、redis概述及哨兵模式 redis對資料快取到記憶體,實現高效快取,使用持久化模組對資料進行儲存,使用sentinel模式實現redis叢集,提供高可用服務。 下面是在巨集觀層面上哨兵模式的功能列表: ·監控:哨兵不斷的檢查master和slave是否正常的執行。

Ubuntu Qt SDK的下載安裝

Qt SDK 低版本很難找到啊, Ubuntu 下的軟體中心能裝Qt creator 裝不上Qt SDK ,怎麼回事。 我一般會選擇 軟體中心來 安裝Qt creator 但裝上Qt 後,在建工程的時候就會如下情況: 好吧,得安裝Qt SDK,其中Qt creator

WindowsMySQL 5.6.27.0.安裝配置

在DOS命令視窗輸入 mysql -h localhost -u root -p回車 進入mysql資料庫,其中-h表示伺服器名,localhost表示本地;-u為資料庫使用者名稱,root是mysql預設使用者名稱;-p為密碼,如果設定了密碼,接下來在Enter password後面輸入設定的密碼, 或

Tesseract 4.0安裝

在macOS上,homebrew預設給我們安裝的是3.0.5(2017年6月)。 想要用4.0版還需要自己編譯,官方教程:Compiling Tesseract 4.0 而官方教程中,macOS用h