1. 程式人生 > >【linux】- centos部署tesseract

【linux】- centos部署tesseract

create cal fig 測試 繁體 源碼 cer export spa

安裝相關依賴

sudo yum install autoconf automake

sudo yum install libjpeg-devel libpng-devel libtiff-devel zlib-devel

安裝leptonica-1.72

wget http://www.leptonica.com/source/leptonica-1.72.tar.gz

tar -xvf leptonica-1.72.tar.gz

cd leptonica-1.72

執行配置指令 ./configure

執行編譯指令 make

執行安裝指令 sudo make install

至此,leptonica安裝完畢

安裝tesseract

wget https://github.com/tesseract-ocr/tesseract/archive/3.04.00.tar.gz

如不能正常下載,可以網盤下載

https://pan.baidu.com/s/1mj6YTIw

提取碼是:95p5

解壓指令 tar xzvf 3.04.00.tar.gz

cd tesseract-3.04.00

分別執行以下指令:

sudo ./autogen.sh

執行配置指令 ./configure

執行編譯指令 make

執行安裝指令 sudo make install

執行指令 sudo ldconfig

這一步安裝可能存在的問題較多,記錄如下:

錯誤1:

技術分享圖片

缺少包,

執行指令:sudo yum install gcc-c++

然後在重新執行 ./configure

錯誤2:

make: Nothing to be done for `all‘

解決:

make clean 清除安裝時留下的文件

在運行一下sudo ldconfig

在重新執行安裝tesseract 步驟

錯誤3:

make[2]: Nothing to be done for `install-exec-am‘.
make[2]: Nothing to be done for `install-data-am‘.

解決:

make clean 清除安裝時留下的文件

在運行一下sudo ldconfig

重新執行安裝tesseract 步驟,其中./configure 改為./configure --prefix=/usr

錯誤4:

make[1]: *** [install-bfd] Error 2
make[1]: Leaving directory `/usr/local/gdb-7.10‘

解決:

./configure --prefix=/usr/local/gdb #不要和gdb-version源碼相同目錄即可。

錯誤5:

ldconfig: Can‘t create temporary cache file /etc/ld.so.cache~: Permission denied

解決:

export LD_LIBRARY_PATH=/usr/local/lib

下載字體

下載安裝英文,中文繁體,中文簡體 識別庫
wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/eng.traineddata
wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/chi_sim.traineddata
wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/chi_tra.traineddata
如不能下載,請參考上面網盤地址進行下載

將剛剛的文件拷貝到tessdata文件夾下:

sudo cp chi_sim.traineddata /usr/local/share/tessdata
sudo cp eng.traineddata /usr/local/share/tessdata
sudo cp eng.traineddata.part /usr/local/share/tessdata

測試

查看版本 tesseract --version

技術分享圖片

cd tesseract-3.04.00

cd testing

技術分享圖片

技術分享圖片

執行 tesseract phototest.tif result -l eng

技術分享圖片

再查看testing目錄下的文件,發現多了一個result.txt:

技術分享圖片

打開 cat result.txt

技術分享圖片

參考:

1、https://blog.csdn.net/wanght89/article/details/78329546

2、https://blog.csdn.net/nsnv_hunter/article/details/79414752

3、https://blog.csdn.net/pangyunsheng/article/details/79372845

【linux】- centos部署tesseract