Java基於百度API的圖片文字識別
使用之前需要獲取對應的專案API_KEY,SECRET_KEY,這些引數在使用API的時候必須用到,用於生成access_token。
如何獲取這些引數:在百度開發者中心申請一個“通用文字識別”專案,然後就可以獲取到這些引數。
1、pom檔案
<?xml version="1.0" encoding="UTF-8"?> <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd"> <modelVersion>4.0.0</modelVersion> <groupId>cn.within</groupId> <artifactId>baiduSearch</artifactId> <version>1.0-SNAPSHOT</version> <build> <plugins> <plugin> <groupId>org.apache.maven.plugins</groupId> <artifactId>maven-compiler-plugin</artifactId> <configuration> <source>1.7</source> <target>1.7</target> </configuration> </plugin> </plugins> </build> <dependencies> <!-- https://mvnrepository.com/artifact/com.alibaba/fastjson --> <dependency> <groupId>com.alibaba</groupId> <artifactId>fastjson</artifactId> <version>1.2.46</version> </dependency> <!-- https://mvnrepository.com/artifact/org.apache.httpcomponents/httpclient --> <dependency> <groupId>org.apache.httpcomponents</groupId> <artifactId>httpclient</artifactId> <version>4.5.5</version> </dependency> <dependency> <groupId>com.vaadin.external.google</groupId> <artifactId>android-json</artifactId> <version>0.0.20131108.vaadin1</version> </dependency> </dependencies> </project>
2、獲取access_token
package search; /** * Created by within on 2018/10/9. */ import org.json.JSONObject; import java.io.BufferedReader; import java.io.InputStreamReader; import java.net.HttpURLConnection; import java.net.URL; import java.util.List; import java.util.Map; /** * 獲取token類 * * @Author : within */ public class AuthService { /** * 獲取許可權token * @return 返回示例: * { * "access_token": "24.460da4889caad24cccdb1fea17221975.2592000.1491995545.282335-1234567", * "expires_in": 2592000 * } */ public static String getAuth() { // 官網獲取的 API Key 更新為你註冊的 String clientId = "0ddYMfgtVSqcE9qMQxHhZ4Yc"; // 官網獲取的 Secret Key 更新為你註冊的 String clientSecret = "XXXNKZlv1gi60a04pzABadI9KgDbfkRM"; return getAuth(clientId, clientSecret); } /** * 獲取API訪問token * 該token有一定的有效期,需要自行管理,當失效時需重新獲取. * @param ak - 百度雲官網獲取的 API Key * @param sk - 百度雲官網獲取的 Securet Key * @return assess_token 示例: * "24.460da4889caad24cccdb1fea17221975.2592000.1491995545.282335-1234567" */ private static String getAuth(String ak, String sk) { // 獲取token地址 String authHost = "https://aip.baidubce.com/oauth/2.0/token?"; String getAccessTokenUrl = authHost // 1\. grant_type為固定引數 + "grant_type=client_credentials" // 2\. 官網獲取的 API Key + "&client_id=" + ak // 3\. 官網獲取的 Secret Key + "&client_secret=" + sk; try { URL realUrl = new URL(getAccessTokenUrl); // 開啟和URL之間的連線 HttpURLConnection connection = (HttpURLConnection) realUrl.openConnection(); connection.setRequestMethod("GET"); connection.connect(); // 獲取所有響應頭欄位 Map<String, List<String>> map = connection.getHeaderFields(); // 遍歷所有的響應頭欄位 for (String key : map.keySet()) { System.err.println(key + "--->" + map.get(key)); } // 定義 BufferedReader輸入流來讀取URL的響應 BufferedReader in = new BufferedReader(new InputStreamReader(connection.getInputStream())); StringBuilder result = new StringBuilder(); String line; while ((line = in.readLine()) != null) { result.append(line); } /** * 返回結果示例 */ System.err.println("result:" + result); JSONObject jsonObject = new JSONObject(result.toString()); return jsonObject.getString("access_token"); } catch (Exception e) { System.err.printf("獲取token失敗!"); e.printStackTrace(System.err); } return null; } public static void main(String[] args) { getAuth(); } }
3、編寫將圖片轉化成base64後再轉化成urlencode的工具類
package search; /** * Created by within on 2018/10/9. */ import sun.misc.BASE64Encoder; import java.io.FileInputStream; import java.io.IOException; import java.io.InputStream; import java.net.URLEncoder; /** * 圖片轉化base64後再UrlEncode結果 * @Author : within */ class BaseImg64 { /** * 將一張本地圖片轉化成Base64字串 * @param imgPath 本地圖片地址 * @return 圖片轉化base64後再UrlEncode結果 */ public static String getImageStrFromPath(String imgPath) { InputStream in; byte[] data = null; // 讀取圖片位元組陣列 try { in = new FileInputStream(imgPath); data = new byte[in.available()]; in.read(data); in.close(); } catch (IOException e) { e.printStackTrace(); } // 對位元組陣列Base64編碼 BASE64Encoder encoder = new BASE64Encoder(); // 返回Base64編碼過再URLEncode的位元組陣列字串 return URLEncoder.encode(encoder.encode(data)); } }
4、編寫呼叫百度API介面的方法,獲取識別結果
package search;
/**
* Created by within on 2018/10/9.
*/
import org.apache.http.HttpResponse;
import org.apache.http.client.HttpClient;
import org.apache.http.client.methods.HttpPost;
import org.apache.http.entity.StringEntity;
import org.apache.http.impl.client.DefaultHttpClient;
import org.apache.http.util.EntityUtils;
import java.io.File;
import java.io.IOException;
import java.net.URI;
import java.net.URISyntaxException;
/**
* 影象文字識別
*
* @Author : within
*/
public class check {
private static final String POST_URL = "https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic?access_token=" + AuthService.getAuth();
/**
* 識別本地圖片的文字
*
* @param path 本地圖片地址
* @return 識別結果,為json格式
* @throws URISyntaxException URI開啟異常
* @throws IOException io流異常
*/
public static String checkFile(String path) throws URISyntaxException, IOException {
File file = new File(path);
if (!file.exists()) {
throw new NullPointerException("圖片不存在");
}
String image = BaseImg64.getImageStrFromPath(path);
String param = "image=" + image;
return post(param);
}
/**
* @param url 圖片url
* @return 識別結果,為json格式
*/
public static String checkUrl(String url) throws IOException, URISyntaxException {
String param = "url=" + url;
return post(param);
}
/**
* 通過傳遞引數:url和image進行文字識別
*
* @param param 區分是url還是image識別
* @return 識別結果
* @throws URISyntaxException URI開啟異常
* @throws IOException IO流異常
*/
private static String post(String param) throws URISyntaxException, IOException {
//開始搭建post請求
HttpClient httpClient = new DefaultHttpClient();
HttpPost post = new HttpPost();
URI url = new URI(POST_URL);
post.setURI(url);
//設定請求頭,請求頭必須為application/x-www-form-urlencoded,因為是傳遞一個很長的字串,不能分段傳送
post.setHeader("Content-Type", "application/x-www-form-urlencoded");
StringEntity entity = new StringEntity(param);
post.setEntity(entity);
HttpResponse response = httpClient.execute(post);
System.out.println(response.toString());
if (response.getStatusLine().getStatusCode() == 200) {
String str;
try {
/*讀取伺服器返回過來的json字串資料*/
str = EntityUtils.toString(response.getEntity());
System.out.println(str);
return str;
} catch (Exception e) {
e.printStackTrace();
return null;
}
}
return null;
}
public static void main(String[] args) {
String path = "D:\\ddd\\b.jpg";
try {
long now = System.currentTimeMillis();
checkFile(path);
checkUrl("https://gss3.bdstatic.com/-Po3dSag_xI4khGkpoWK1HF6hhy/baike/c0%3Dbaike80%2C5%2C5%2C80%2C26/sign=08c05c0e8444ebf8797c6c6db890bc4f/fc1f4134970a304e46bfc5f7d2c8a786c9175c19.jpg");
System.out.println("耗時:" + (System.currentTimeMillis() - now) / 1000 + "s");
} catch (URISyntaxException | IOException e) {
e.printStackTrace();
}
}
}
5、結果對比:
HTTP/1.1 200 OK [Appid: 14374247, Connection: keep-alive, Content-Type: application/json, Date: Tue, 09 Oct 2018 02:33:39 GMT, P3p: CP=" OTI DSP COR IVA OUR IND COM ", P3p: CP=" OTI DSP COR IVA OUR IND COM ", P3p: CP=" OTI DSP COR IVA OUR IND COM ", Server: Apache, Set-Cookie: BAIDUID=85ED51BC904917BC65233AB4200AD43E:FG=1; expires=Wed, 09-Oct-19 02:33:39 GMT; max-age=31536000; path=/; domain=.baidu.com; version=1, Set-Cookie: BAIDUID=90083625BD94E791CA9F2204797662B5:FG=1; expires=Thu, 31-Dec-37 23:55:55 GMT; max-age=2145916555; path=/; domain=.baidu.com; version=1, Set-Cookie: BAIDUID=08654EC80A32DEBA38E50B18A85EDC5D:FG=1; expires=Thu, 31-Dec-37 23:55:55 GMT; max-age=2145916555; path=/; domain=.baidu.com; version=1, Tracecode: 20198605130249338634100910, Vary: Accept-Encoding, Vary: Accept-Encoding, Content-Length: 317] [email protected]
{"log_id": 597441327730160468, "words_result_num": 5, "words_result": [{"words": "你想過普通的生活就會遇到普通的挫折"}, {"words": "你想過上最好的生活②"}, {"words": "就一定會遇上最強的傷害"}, {"words": "這世界很公平"}, {"words": "你想要最好就一定會給你最痛"}]}
十月 09, 2018 10:33:39 上午 org.apache.http.client.protocol.ResponseProcessCookies processCookies
相關推薦
Java呼叫百度API實現文字識別-羅紹崗-專題視訊課程
Java呼叫百度API實現文字識別—242人已學習 課程介紹 java呼叫百度AI文字識別SDK來實現一張圖片的文字資訊 課程收益  
百度api圖片文字識別
from aip import AipOcr """ 讀取圖片 """ def get_file_content(filePath): with open(filePath, 'rb') as fp: return fp.read() def get_text():
Java-基於百度API的圖片文字識別(支援中文,英文和中英文混合)
PS: 基於Java 1.8 版本控制:maven 使用之前需要獲取對應的專案API_KEY,SECRET_KEY,這些引數在使用API的時候必須用到,
Java-基於百度API的圖片文字識別(支援中文,英文和中英文混合)貨運APP開發找上海捌躍網路科技有限公司
PS: 基於Java 1.8 版本控制:maven 使用之前需要獲取對應的專案API_KEY,SECRET_KEY,這些引數在使用API的時候必須用到,用於生成access_token。 如何獲取這些引數:在百度開發者中心申請一個“通用文字識別”專案,然後就可
Java基於百度API的圖片文字識別
使用之前需要獲取對應的專案API_KEY,SECRET_KEY,這些引數在使用API的時候必須用到,用於生成access_token。 如何獲取這些引數:在百度開發者中心申請一個“通用文字識別”專案,然後就可以獲取到這些引數。 1、pom檔案 <?xml v
基於百度AI的文字識別-Python
使用百度AI的文字識別庫,做出的呼叫示例,其中filePath是圖片的路徑,可以自行傳入一張帶有文字的圖片,進行識別。 下載baidu-aip這個庫,可以直接使用pip下載:pip install
使用百度api進行文字識別,完成英語作業
使用百度API進行文字識別,完成英語作業介紹這學期選了一門英語翻譯課,作業需要提交翻譯稿,但是老師為了防止我們利用翻譯軟體複製貼上,很精明的把需要翻譯的內容拍成了照片發給了我們。為了更“快”更“好“的完成作業,我就突發奇想,如果使用ocr識別照片中的文字,就不用手動把照片裡面
python利用百度API進行文字識別
首先需要在百度的AI中新建一個應用列表,獲取我們需要的API Key與Secret Key 按照百度官方API的demo,可以獲取到token_id #client_id 為官網獲取的AK, client_secret 為官網獲取的SK host = 'https:/
基於百度API,實現圖片文字識別功能(Java版)
1、登入百度AI開放平臺 (1)在頂部導航欄中,找到控制檯選項,並選擇文字識別功能,進入管理中心頁面 (2)在管理中心頁面中,找到建立應用按鈕並點選 (3)填寫應用名名稱和應用描述,選擇相應的應用型別,勾選自己需要的介面服
java 根據圖片url識別圖片簡單例項(百度雲通用文字識別)
1.百度雲通用文字識別,首先註冊百度雲賬號,建立應用 2.建立完應用後能夠檢視自己的 OK, 可以用我寫的程式碼識別圖片了 package com.teamdev.jxbrowser.chromium.demo.京東.根據店鋪名稱搜尋商品資料; i
Java實現百度雲OCR介面識別圖片文字資訊(也包含身份證,銀行卡識別,更新新增通用票據識別)
1.需求背景 因專案需求,需要提取身份證、發票(9/16更新內容)、榮譽證書上的文字資訊,與相關檔案進行匹配,而查閱相關資料,經過對比之後,發現用百度OCR文字識別API服務可以相應解決相關問題,識別率較好。當然,還不能夠做到完全匹配,也有其中不足的地方,例如,發票中公章資訊不能提取;發票周
Java文字識別軟體-呼叫百度ocr實現文字識別
java_baidu_ocr Java呼叫百度OCR文字識別API實現圖片文字識別軟體 專案原始碼在文末,放到了GitHub上 - https://github.com/Ymy214/java_baidu_ocr 識別圖一 圖一識別結果 識別圖二 圖二識別結果 識別圖三
百度地圖熱力圖--批量地址轉換應用(基於百度api)
ldp item keyvalue 使用 創建地圖 ebr efault amp ont 需求:把外賣訂餐地址做個用戶分布熱力圖 思路分析:第一步去百度地圖api開放平臺找例子 http://lbsyun.baidu.com/jsdemo.htm#c1_15 首
Java呼叫百度API實現翻譯-羅紹崗-專題視訊課程
Java呼叫百度API實現翻譯—390人已學習 課程介紹 java呼叫百度API實現中英文翻譯 課程收益 此課程學習後可以反駁領悟
Java呼叫百度API實現翻譯
教程地址 下面是Java呼叫百度API實現翻譯的具體步驟: 一、在寫程式碼之前先在在百度翻譯平臺中,申請APP_ID 申請地址申請的詳見 點選開啟連結 申請之後,會得到APP_ID和SECURITY_KEY 二、java程式碼如
百度API通用物體識別(簡單使【實】用)
package com.asdf.map_to_face.util.baiduApi; import com.baidu.aip.imageclassify.AipImageClassify; import org.json.JSONObject; import java.io.IOExcept
【基於百度AI的人臉識別Python實現】
呼叫百度AI的baidu-aip庫進行人臉識別,baidu-aip庫可以使用pip install baidu-aip進行安裝 關於人臉檢測請求引數可參考傳送門 執行程式碼如下: # coding=UTF-8 # 利用baidu-aip庫進行人臉識別 import cv2
利用java呼叫百度API介面,解析返回的json資料,突破百度API介面呼叫結果的限制
近一段時間的專案的核心是百度API的POI(興趣點)資料,所以需要呼叫百度API資料,下面就來講一下整個流程和遇到的問題及解決辦法。 首先要檢視百度API文件,連結如下:http://lbsyun.baidu.com/index.php?title=webapi 專案中主要用到的是Plac
Java基於百度AI+JavaCV+OpenCV 實現攝像頭人數動態統計
本文是基於上一篇進行迭代的。本文主要是以攝像頭畫面進行人流量統計。並對返回影象進行展示。需要額外瞭解JavaCV OpenCV swing awt等 也許JavaCV OpenCV 不需要也可以實現效果。但是小帥丶就先用這樣的方式實現了。別的方式大家就自己
百度雲OCR文字識別使用
上篇《Java 使用 Tess4J 實現圖片識別文字》一文中雖然圖片可以識別中文,但是達不到預期的效果,所以今天抽出時間來整理記錄一下關於百度雲OCR,相對於Tess4J來說,識別度還可以 註冊百度AI的賬號,具體參照 http://ai.baidu.com/docs#/Begin