【linux】- centos部署tesseract
安裝相關依賴
sudo yum install autoconf automake
sudo yum install libjpeg-devel libpng-devel libtiff-devel zlib-devel
安裝leptonica-1.72
wget http://www.leptonica.com/source/leptonica-1.72.tar.gz
tar -xvf leptonica-1.72.tar.gz
cd leptonica-1.72
執行配置指令 ./configure
執行編譯指令 make
執行安裝指令 sudo make install
至此,leptonica安裝完畢
安裝tesseract
wget https://github.com/tesseract-ocr/tesseract/archive/3.04.00.tar.gz
如不能正常下載,可以網盤下載
https://pan.baidu.com/s/1mj6YTIw
提取碼是:95p5
解壓指令 tar xzvf 3.04.00.tar.gz
cd tesseract-3.04.00
分別執行以下指令:
sudo ./autogen.sh
執行配置指令 ./configure
執行編譯指令 make
執行安裝指令 sudo make install
執行指令 sudo ldconfig
這一步安裝可能存在的問題較多,記錄如下:
錯誤1:
缺少包,
執行指令:sudo yum install gcc-c++
然後在重新執行 ./configure
錯誤2:
make: Nothing to be done for `all‘
解決:
make clean 清除安裝時留下的文件
在運行一下sudo ldconfig
在重新執行安裝tesseract 步驟
錯誤3:
make[2]: Nothing to be done for `install-exec-am‘.
make[2]: Nothing to be done for `install-data-am‘.
解決:
make clean 清除安裝時留下的文件
在運行一下sudo ldconfig
重新執行安裝tesseract 步驟,其中./configure 改為./configure --prefix=/usr
錯誤4:
make[1]: *** [install-bfd] Error 2
make[1]: Leaving directory `/usr/local/gdb-7.10‘
解決:
./configure --prefix=/usr/local/gdb #不要和gdb-version源碼相同目錄即可。
錯誤5:
ldconfig: Can‘t create temporary cache file /etc/ld.so.cache~: Permission denied
解決:
export LD_LIBRARY_PATH=/usr/local/lib
下載字體
下載安裝英文,中文繁體,中文簡體 識別庫
wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/eng.traineddata
wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/chi_sim.traineddata
wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/chi_tra.traineddata
如不能下載,請參考上面網盤地址進行下載
將剛剛的文件拷貝到tessdata文件夾下:
sudo cp chi_sim.traineddata /usr/local/share/tessdata
sudo cp eng.traineddata /usr/local/share/tessdata
sudo cp eng.traineddata.part /usr/local/share/tessdata
測試
查看版本 tesseract --version
cd tesseract-3.04.00
cd testing
執行 tesseract phototest.tif result -l eng
再查看testing目錄下的文件,發現多了一個result.txt:
打開 cat result.txt
參考:
1、https://blog.csdn.net/wanght89/article/details/78329546
2、https://blog.csdn.net/nsnv_hunter/article/details/79414752
3、https://blog.csdn.net/pangyunsheng/article/details/79372845
【linux】- centos部署tesseract