java 使用 Tess4J 進行影象識別

阿新 • • 發佈：2018-12-27

在網上找了好多關於orc的資料,文件自己也demo了好幾個都不咋地靠譜.後來發現一個挺不錯的文件,自己也試著demo了下沒有

再想前幾個一樣報各種未知的錯誤.

轉原文地址

圖片成功識別出來,但是識別率還是有點低..

第一步下載 Tess4J 的一些資源 http://tess4j.sourceforge.net/codesample.html

下載下來後解壓

然後在eclipse 或者 idea 裡面新建一個 java 工程(普通java工程就可以)

然後將上面的 lib,tessdata(語音包) 包 copy到你的工程下面去. 還需要將 dist 中的 tess4j.jar 包放在lib下面

再前面找的一些資料,部落格讓把src包也直接複製過去. 但是我測試的結果時失敗,應該是我少了一些步驟吧,我也沒找出來.

然後呢將新增的jar包如果是eclipse 直接選中所有jar包右擊（Build path --> configure build path）新增到專案中去.

idea的話我也剛用所有很多操作都不熟悉,在此將步驟貼出來

點選頭部選單file --> Project Structure 也可以使用快捷鍵(Ctrl+Alt+Shift+s)

然後開啟選擇 Modules -> Dependencies - > 然後點選 + -> Jars or directores

然後將你要匯入的jar包選中點選ok

最後就是 Test

import net.sourceforge.tess4j.ITesseract;
import net.sourceforge.tess4j.Tesseract;
import net.sourceforge.tess4j.TesseractException;
import java.io.File;
import java.io.IOException;

public class Main {
    public static void main(String[] args) {
        //  當前專案存放路徑
        String path = "D://java//eclipse-work//web//orc";
        // 要識別的圖片
        File file = new File("E://2.png");
        ITesseract instance = new Tesseract();

        /**
         *  獲取專案根路徑，
         */
        File directory = new File(path);
        String courseFile = null;
        try {
            courseFile = directory.getCanonicalPath();
        } catch (IOException e) {
            e.printStackTrace();
        }

        //設定訓練庫的位置
        instance.setDatapath(courseFile + "/tessdata");
        //chi_sim ：簡體中文， eng	根據需求選擇語言庫
        instance.setLanguage("chi_sim");
        String result = null;
        try {
            long startTime = System.currentTimeMillis();
            result =  instance.doOCR(file);
            long endTime = System.currentTimeMillis();
            System.out.println("Time is：" + (endTime - startTime) + " 毫秒");
        } catch (TesseractException e) {
            e.printStackTrace();
        }
        System.out.println("result: ");
        System.out.println(result);
    }
}

執行結果原圖:

大致還是解析出來了//,識別率還是有點低.

java 使用 Tess4J 進行影象識別

在網上找了好多關於orc的資料,文件自己也demo了好幾個都不咋地靠譜.後來發現一個挺不錯的文件,自己也試著demo了下沒有再想前幾個一樣報各種未知的錯誤. 轉原文地址圖片成功識別出來,但是識別率還是有點低.. 第一步下載 Tess4J 的一些資源 &nbs

Java 使用 Tess4J 實現影象識別

最近需要用Java做一個影象識別的東西，查了一些資料，在此寫一個基於Tess4J的教程，方便其他人蔘考和使用。其實做影象識別，也可以使用TESSERACT-OCR來實現，但是該方式需要下載軟體，在電腦上安裝環境，移植性不高，使用Tess4J只需要下載相關Jar包，匯入專案，再

用C#進行影象識別與資料採集進而實現對視訊裡的資料採集

窗體佈局的滑鼠移動距離問題oledb資料型別不一致如何更新窗體佈局的滑鼠移動距離問題oledb資料型別不一致如何更新我的vs2008今天怎麼不能用了啊麻煩進來看看為什麼開發windowsForm程式Gridview隱身無法使用我的vs2008今天怎麼不能用了啊麻煩進來看看為

深度學習框架Tensorflow學習與應用(八儲存和載入模型，使用Google的影象識別網路inception-v3進行影象識別)

一模型的儲存 [email protected]:~/tensorflow$ cat 8-1saver_save.py # coding: utf-8 # In[1]: import tensorflow as tf from tensorflow.examples.tutorials

tess4j做影象識別

tess4j用於識別影象上的文字資訊，步驟如下： 1.下載tesseract的安裝包： https://sourceforge.net/projects/tesseract-ocr-alt/file

android中利用opencv進行影象識別

之前開發的時候老大讓研究下影象識別的功能，同事推薦看看opencv，發現對於移動端來說opencv的資料和demo都比較少，現在整理下之前的工作成果。首先是進行配置工作，先匯入opencv的一個程式碼模組之後是匯入opencv的具體的演算法，當然是c

使用opencv的dnn模組進行影象識別

專案地址：https://github.com/zhongqianli/cifar10_classification.git opencv3.4的dnn模組已經支援caffe、tensorflow、pytorch等主流深度學習框架訓練的模型。本文用caffe預先在cifar10

matlab 關於利用深度學習進行影象識別

深度學習進行影象識別現在主要是利用CNN來進行操作，其中影象預處理涉及到灰度處理，零均值，影象分割，影象增強等等，比較多。最近在用matlab進行影象識別這一方面的實驗，在matlab官網上出了很多這樣的例子，提出裡兩種方法：training from scratch和tr

iOS中使用opencv進行影象識別操作(一)步驟很多，這一篇只是講了第一步.

前言OpenCV ，是一個開源的跨平臺計算機視覺和機器學習庫，通俗點的說，就是他給計算機提供了一雙眼睛，一雙可以從圖片中獲取資訊的眼鏡，從而完成人臉識別、去紅眼、追蹤移動物體等等的影象相關的功能。更多具體的說明可參見 OpenCV 官網。匯入工程匯入 OpenCV 到 Xco

[影象識別] java語言使用tess4j識別圖片中的文字

之所以寫下這篇文章，是因為在實踐中使用時，發現在識別整張圖時，準確率降低。尤其是中文，英文，字元，數字，水印都有的時候。出錯率很高。原先一直認為是水印的問題。結果將圖片二值化以後，沒有水印，識別準確度依舊很低。偶然的情況，使用區域性區域識別，發現，效果很好，

java利用tesseract-OCR對影象進行字元識別

try { Process pro = Runtime.getRuntime() .exec(new String[]{"D:/Program Files (x86)/Tesseract-OCR/tesseract.exe",

調用騰訊優圖開放平臺進行人臉識別-Java調用API實現

ace tno 開放平臺 term href max pre ant water ttp://open.youtu.qq.com官網騰訊產品文檔直接234. 第一步：鑒權服務技術方案 Java代碼實現如下 import java.util.Date;

Unity 影象識別接入Face++ 進行場景識別和文字識別

首先需要去Face++註冊一個賬號：（https://console.faceplusplus.com.cn/login）註冊非常簡單這裡就不講了。建立完我們登入後悔進入如下介面。接著我們去建立一個應用（也就是建立一個API Key，這個非常重要）如下：現在我們去找

Java文字影象識別 1

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

動態HTML處理和機器影象識別-----案例：嘗試對驗證碼進行機器識別處理

嘗試對知乎網驗證碼進行處理：許多流行的內容管理系統即使加了驗證碼模組，其眾所周知的註冊頁面也經常會遭到網路機器人的垃圾註冊。那麼，這些網路機器人究，竟是怎麼做的呢?既然我們已經，可以成功地識別出儲存在電腦上的驗證碼了，那麼如何才能實現一個全能的網路機器人呢? 大多數網站生成的驗證碼圖片都具有以下

Julia機器學習實戰——使用Random Forest隨機森林進行字元影象識別

文章目錄 0 Preface 1 載入資料 2 訓練隨機森林（train RF） 3 完整程式碼 0 Preface 相關引數說明 - Julia: 1.0 - OS: MacOS

1.3.1 Julia機器學習實戰——使用Random Forest隨機森林進行字元影象識別

0 Preface 相關引數說明 - Julia: 1.0 - OS: MacOS 訓練測試資料百度雲連結：點選下載密碼: u71o 檔案說明： - rf_julia_charReg - resizeData.py #批量

利用Inception-v3現成權重進行特徵提取（影象識別）

在tensorflow官網的影象識別的中文介紹中，介紹瞭如何用Tensorflow的模型程式碼庫中的classify_image.py進行影象識別。裡面有介紹如何測試，而且還提供了最後一層的1*1*2048維的特徵提取方式，所以在這裡介紹一下。 ...... with tf.Session

使用TensorFlow進行訓練識別視訊影象中物體

本教程針對Windows10實現谷歌公佈的TensorFlow Object Detection

Java 使用 Tess4J 實現圖片識別文字

今天研究了一個Tess4J 技術，中文基本上完全可以識別，分享一下，可參考或直接使用下載 Tess4J jar，網址：http://sourceforge.net/projects/tess4j/ 專案整合：把相關的jar放入lib中然後把tessdata 放入和src同級

java 使用 Tess4J 進行影象識別

相關推薦