1. 程式人生 > >Java基於百度API的圖片文字識別

Java基於百度API的圖片文字識別

使用之前需要獲取對應的專案API_KEY,SECRET_KEY,這些引數在使用API的時候必須用到,用於生成access_token。
如何獲取這些引數:在百度開發者中心申請一個“通用文字識別”專案,然後就可以獲取到這些引數。

1、pom檔案

<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0</modelVersion>

    <groupId>cn.within</groupId>
    <artifactId>baiduSearch</artifactId>
    <version>1.0-SNAPSHOT</version>
    <build>
        <plugins>
            <plugin>
                <groupId>org.apache.maven.plugins</groupId>
                <artifactId>maven-compiler-plugin</artifactId>
                <configuration>
                    <source>1.7</source>
                    <target>1.7</target>
                </configuration>
            </plugin>
        </plugins>
    </build>
    <dependencies>
    <!-- https://mvnrepository.com/artifact/com.alibaba/fastjson -->
    <dependency>
        <groupId>com.alibaba</groupId>
        <artifactId>fastjson</artifactId>
        <version>1.2.46</version>
    </dependency>
    <!-- https://mvnrepository.com/artifact/org.apache.httpcomponents/httpclient -->
    <dependency>
        <groupId>org.apache.httpcomponents</groupId>
        <artifactId>httpclient</artifactId>
        <version>4.5.5</version>
    </dependency>
    <dependency>
        <groupId>com.vaadin.external.google</groupId>
        <artifactId>android-json</artifactId>
        <version>0.0.20131108.vaadin1</version>
    </dependency>
</dependencies>

</project>

 2、獲取access_token

package search;

/**
 * Created by within on 2018/10/9.
 */
import org.json.JSONObject;
import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.net.HttpURLConnection;
import java.net.URL;
import java.util.List;
import java.util.Map;
/**
 * 獲取token類
 *
 * @Author : within
 */

public class AuthService {

    /**
     * 獲取許可權token
     * @return 返回示例:
     * {
     * "access_token": "24.460da4889caad24cccdb1fea17221975.2592000.1491995545.282335-1234567",
     * "expires_in": 2592000
     * }
     */
    public static String getAuth() {
        // 官網獲取的 API Key 更新為你註冊的
        String clientId = "0ddYMfgtVSqcE9qMQxHhZ4Yc";
        // 官網獲取的 Secret Key 更新為你註冊的
        String clientSecret = "XXXNKZlv1gi60a04pzABadI9KgDbfkRM";
        return getAuth(clientId, clientSecret);
    }

    /**
     * 獲取API訪問token
     * 該token有一定的有效期,需要自行管理,當失效時需重新獲取.
     * @param ak - 百度雲官網獲取的 API Key
     * @param sk - 百度雲官網獲取的 Securet Key
     * @return assess_token 示例:
     * "24.460da4889caad24cccdb1fea17221975.2592000.1491995545.282335-1234567"
     */
    private static String getAuth(String ak, String sk) {
        // 獲取token地址
        String authHost = "https://aip.baidubce.com/oauth/2.0/token?";
        String getAccessTokenUrl = authHost
                // 1\. grant_type為固定引數
                + "grant_type=client_credentials"
                // 2\. 官網獲取的 API Key
                + "&client_id=" + ak
                // 3\. 官網獲取的 Secret Key
                + "&client_secret=" + sk;
        try {
            URL realUrl = new URL(getAccessTokenUrl);
            // 開啟和URL之間的連線
            HttpURLConnection connection = (HttpURLConnection) realUrl.openConnection();
            connection.setRequestMethod("GET");
            connection.connect();
            // 獲取所有響應頭欄位
            Map<String, List<String>> map = connection.getHeaderFields();
            // 遍歷所有的響應頭欄位
            for (String key : map.keySet()) {
                System.err.println(key + "--->" + map.get(key));
            }
            // 定義 BufferedReader輸入流來讀取URL的響應
            BufferedReader in = new BufferedReader(new InputStreamReader(connection.getInputStream()));
            StringBuilder result = new StringBuilder();
            String line;
            while ((line = in.readLine()) != null) {
                result.append(line);
            }
            /**
             * 返回結果示例
             */
            System.err.println("result:" + result);
            JSONObject jsonObject = new JSONObject(result.toString());
            return jsonObject.getString("access_token");
        } catch (Exception e) {
            System.err.printf("獲取token失敗!");
            e.printStackTrace(System.err);
        }
        return null;
    }

    public static void main(String[] args) {
        getAuth();
    }

}

3、編寫將圖片轉化成base64後再轉化成urlencode的工具類

package search;

/**
 * Created by within on 2018/10/9.
 */
import sun.misc.BASE64Encoder;

import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStream;
import java.net.URLEncoder;

/**
 * 圖片轉化base64後再UrlEncode結果
 * @Author : within
 */

class BaseImg64 {
    /**
     * 將一張本地圖片轉化成Base64字串
     * @param imgPath 本地圖片地址
     * @return 圖片轉化base64後再UrlEncode結果
     */
    public static String getImageStrFromPath(String imgPath) {
        InputStream in;
        byte[] data = null;
        // 讀取圖片位元組陣列
        try {
            in = new FileInputStream(imgPath);
            data = new byte[in.available()];
            in.read(data);
            in.close();
        } catch (IOException e) {
            e.printStackTrace();
        }
        // 對位元組陣列Base64編碼
        BASE64Encoder encoder = new BASE64Encoder();
        // 返回Base64編碼過再URLEncode的位元組陣列字串
        return URLEncoder.encode(encoder.encode(data));
    }
}

 4、編寫呼叫百度API介面的方法,獲取識別結果

package search;

/**
 * Created by within on 2018/10/9.
 */
import org.apache.http.HttpResponse;
import org.apache.http.client.HttpClient;
import org.apache.http.client.methods.HttpPost;
import org.apache.http.entity.StringEntity;
import org.apache.http.impl.client.DefaultHttpClient;
import org.apache.http.util.EntityUtils;

import java.io.File;
import java.io.IOException;
import java.net.URI;
import java.net.URISyntaxException;

/**
 * 影象文字識別
 *
 * @Author : within
 */

public class check {
    private static final String POST_URL = "https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic?access_token=" + AuthService.getAuth();

    /**
     * 識別本地圖片的文字
     *
     * @param path 本地圖片地址
     * @return 識別結果,為json格式
     * @throws URISyntaxException URI開啟異常
     * @throws IOException        io流異常
     */
    public static String checkFile(String path) throws URISyntaxException, IOException {
        File file = new File(path);
        if (!file.exists()) {
            throw new NullPointerException("圖片不存在");
        }
        String image = BaseImg64.getImageStrFromPath(path);
        String param = "image=" + image;
        return post(param);
    }

    /**
     * @param url 圖片url
     * @return 識別結果,為json格式
     */
    public static String checkUrl(String url) throws IOException, URISyntaxException {
        String param = "url=" + url;
        return post(param);
    }

    /**
     * 通過傳遞引數:url和image進行文字識別
     *
     * @param param 區分是url還是image識別
     * @return 識別結果
     * @throws URISyntaxException URI開啟異常
     * @throws IOException        IO流異常
     */
    private static String post(String param) throws URISyntaxException, IOException {
        //開始搭建post請求
        HttpClient httpClient = new DefaultHttpClient();
        HttpPost post = new HttpPost();
        URI url = new URI(POST_URL);
        post.setURI(url);
        //設定請求頭,請求頭必須為application/x-www-form-urlencoded,因為是傳遞一個很長的字串,不能分段傳送
        post.setHeader("Content-Type", "application/x-www-form-urlencoded");
        StringEntity entity = new StringEntity(param);
        post.setEntity(entity);
        HttpResponse response = httpClient.execute(post);
        System.out.println(response.toString());
        if (response.getStatusLine().getStatusCode() == 200) {
            String str;
            try {
                /*讀取伺服器返回過來的json字串資料*/
                str = EntityUtils.toString(response.getEntity());
                System.out.println(str);
                return str;
            } catch (Exception e) {
                e.printStackTrace();
                return null;
            }
        }
        return null;
    }

    public static void main(String[] args) {
        String path = "D:\\ddd\\b.jpg";
        try {
            long now = System.currentTimeMillis();
            checkFile(path);
            checkUrl("https://gss3.bdstatic.com/-Po3dSag_xI4khGkpoWK1HF6hhy/baike/c0%3Dbaike80%2C5%2C5%2C80%2C26/sign=08c05c0e8444ebf8797c6c6db890bc4f/fc1f4134970a304e46bfc5f7d2c8a786c9175c19.jpg");
            System.out.println("耗時:" + (System.currentTimeMillis() - now) / 1000 + "s");
        } catch (URISyntaxException | IOException e) {
            e.printStackTrace();
        }
    }
}

5、結果對比:

 

 HTTP/1.1 200 OK [Appid: 14374247, Connection: keep-alive, Content-Type: application/json, Date: Tue, 09 Oct 2018 02:33:39 GMT, P3p: CP=" OTI DSP COR IVA OUR IND COM ", P3p: CP=" OTI DSP COR IVA OUR IND COM ", P3p: CP=" OTI DSP COR IVA OUR IND COM ", Server: Apache, Set-Cookie: BAIDUID=85ED51BC904917BC65233AB4200AD43E:FG=1; expires=Wed, 09-Oct-19 02:33:39 GMT; max-age=31536000; path=/; domain=.baidu.com; version=1, Set-Cookie: BAIDUID=90083625BD94E791CA9F2204797662B5:FG=1; expires=Thu, 31-Dec-37 23:55:55 GMT; max-age=2145916555; path=/; domain=.baidu.com; version=1, Set-Cookie: BAIDUID=08654EC80A32DEBA38E50B18A85EDC5D:FG=1; expires=Thu, 31-Dec-37 23:55:55 GMT; max-age=2145916555; path=/; domain=.baidu.com; version=1, Tracecode: 20198605130249338634100910, Vary: Accept-Encoding, Vary: Accept-Encoding, Content-Length: 317] [email protected]
{"log_id": 597441327730160468, "words_result_num": 5, "words_result": [{"words": "你想過普通的生活就會遇到普通的挫折"}, {"words": "你想過上最好的生活②"}, {"words": "就一定會遇上最強的傷害"}, {"words": "這世界很公平"}, {"words": "你想要最好就一定會給你最痛"}]}
十月 09, 2018 10:33:39 上午 org.apache.http.client.protocol.ResponseProcessCookies processCookies

 

 

相關推薦

Java呼叫API實現文字識別-羅紹崗-專題視訊課程

Java呼叫百度API實現文字識別—242人已學習 課程介紹         java呼叫百度AI文字識別SDK來實現一張圖片的文字資訊 課程收益     

api圖片文字識別

from aip import AipOcr """ 讀取圖片 """ def get_file_content(filePath): with open(filePath, 'rb') as fp: return fp.read() def get_text():

Java-基於API圖片文字識別(支援中文,英文和中英文混合)

PS: 基於Java 1.8 版本控制:maven 使用之前需要獲取對應的專案API_KEY,SECRET_KEY,這些引數在使用API的時候必須用到,

Java-基於API圖片文字識別(支援中文,英文和中英文混合)貨運APP開發找上海捌躍網路科技有限公司

PS: 基於Java 1.8 版本控制:maven 使用之前需要獲取對應的專案API_KEY,SECRET_KEY,這些引數在使用API的時候必須用到,用於生成access_token。 如何獲取這些引數:在百度開發者中心申請一個“通用文字識別”專案,然後就可

Java基於API圖片文字識別

使用之前需要獲取對應的專案API_KEY,SECRET_KEY,這些引數在使用API的時候必須用到,用於生成access_token。 如何獲取這些引數:在百度開發者中心申請一個“通用文字識別”專案,然後就可以獲取到這些引數。 1、pom檔案 <?xml v

基於AI的文字識別-Python

使用百度AI的文字識別庫,做出的呼叫示例,其中filePath是圖片的路徑,可以自行傳入一張帶有文字的圖片,進行識別。 下載baidu-aip這個庫,可以直接使用pip下載:pip install

使用api進行文字識別,完成英語作業

使用百度API進行文字識別,完成英語作業介紹這學期選了一門英語翻譯課,作業需要提交翻譯稿,但是老師為了防止我們利用翻譯軟體複製貼上,很精明的把需要翻譯的內容拍成了照片發給了我們。為了更“快”更“好“的完成作業,我就突發奇想,如果使用ocr識別照片中的文字,就不用手動把照片裡面

python利用API進行文字識別

首先需要在百度的AI中新建一個應用列表,獲取我們需要的API Key與Secret Key 按照百度官方API的demo,可以獲取到token_id #client_id 為官網獲取的AK, client_secret 為官網獲取的SK host = 'https:/

基於API,實現圖片文字識別功能(Java版)

1、登入百度AI開放平臺     (1)在頂部導航欄中,找到控制檯選項,並選擇文字識別功能,進入管理中心頁面        (2)在管理中心頁面中,找到建立應用按鈕並點選   (3)填寫應用名名稱和應用描述,選擇相應的應用型別,勾選自己需要的介面服

java 根據圖片url識別圖片簡單例項(雲通用文字識別)

1.百度雲通用文字識別,首先註冊百度雲賬號,建立應用  2.建立完應用後能夠檢視自己的 OK, 可以用我寫的程式碼識別圖片了   package com.teamdev.jxbrowser.chromium.demo.京東.根據店鋪名稱搜尋商品資料; i

Java實現雲OCR介面識別圖片文字資訊(也包含身份證,銀行卡識別,更新新增通用票據識別

1.需求背景 因專案需求,需要提取身份證、發票(9/16更新內容)、榮譽證書上的文字資訊,與相關檔案進行匹配,而查閱相關資料,經過對比之後,發現用百度OCR文字識別API服務可以相應解決相關問題,識別率較好。當然,還不能夠做到完全匹配,也有其中不足的地方,例如,發票中公章資訊不能提取;發票周

Java文字識別軟體-呼叫ocr實現文字識別

java_baidu_ocr Java呼叫百度OCR文字識別API實現圖片文字識別軟體 專案原始碼在文末,放到了GitHub上 - https://github.com/Ymy214/java_baidu_ocr 識別圖一 圖一識別結果 識別圖二 圖二識別結果 識別圖三

地圖熱力圖--批量地址轉換應用(基於api

ldp item keyvalue 使用 創建地圖 ebr efault amp ont 需求:把外賣訂餐地址做個用戶分布熱力圖 思路分析:第一步去百度地圖api開放平臺找例子 http://lbsyun.baidu.com/jsdemo.htm#c1_15 首

Java呼叫API實現翻譯-羅紹崗-專題視訊課程

Java呼叫百度API實現翻譯—390人已學習 課程介紹         java呼叫百度API實現中英文翻譯 課程收益     此課程學習後可以反駁領悟

Java呼叫API實現翻譯

  教程地址 下面是Java呼叫百度API實現翻譯的具體步驟: 一、在寫程式碼之前先在在百度翻譯平臺中,申請APP_ID   申請地址申請的詳見 點選開啟連結 申請之後,會得到APP_ID和SECURITY_KEY 二、java程式碼如

API通用物體識別(簡單使【實】用)

package com.asdf.map_to_face.util.baiduApi; import com.baidu.aip.imageclassify.AipImageClassify; import org.json.JSONObject; import java.io.IOExcept

基於AI的人臉識別Python實現】

呼叫百度AI的baidu-aip庫進行人臉識別,baidu-aip庫可以使用pip install baidu-aip進行安裝 關於人臉檢測請求引數可參考傳送門 執行程式碼如下: # coding=UTF-8 # 利用baidu-aip庫進行人臉識別 import cv2

利用java呼叫API介面,解析返回的json資料,突破API介面呼叫結果的限制

近一段時間的專案的核心是百度API的POI(興趣點)資料,所以需要呼叫百度API資料,下面就來講一下整個流程和遇到的問題及解決辦法。 首先要檢視百度API文件,連結如下:http://lbsyun.baidu.com/index.php?title=webapi 專案中主要用到的是Plac

Java基於AI+JavaCV+OpenCV 實現攝像頭人數動態統計

本文是基於上一篇進行迭代的。本文主要是以攝像頭畫面進行人流量統計。並對返回影象進行展示。需要額外瞭解JavaCV OpenCV swing awt等  也許JavaCV OpenCV  不需要也可以實現效果。但是小帥丶就先用這樣的方式實現了。別的方式大家就自己

雲OCR文字識別使用

上篇《Java 使用 Tess4J 實現圖片識別文字》一文中雖然圖片可以識別中文,但是達不到預期的效果,所以今天抽出時間來整理記錄一下關於百度雲OCR,相對於Tess4J來說,識別度還可以 註冊百度AI的賬號,具體參照 http://ai.baidu.com/docs#/Begin