1. 程式人生 > >使用騰訊OCR識別提取圖片中的文字

使用騰訊OCR識別提取圖片中的文字

使用騰訊的OCR,官方文件上給出兩種方式,一種是自己寫請求,一種是使用騰訊整合的SDk,本次使用的是SDK,下載地址為:https://cloud.tencent.com/document/product/866/17600,根據需要選擇對應的SDK下載,本次以OCR-通用印刷體識別

下面需要將這個SDK調通。首先找到demo主類,將下面的四個引數換成自己的引數:,其中前三個引數自己很容易理解並找到

但是bucketName很多人不知道是什麼(bucketName引數如果不使用SDK方式則不需要),其實bucketName是騰訊雲的物件儲存的儲存桶的名稱,下圖中標記的引數就是你的bucketName值

因為此次呼叫的是OCR-通用印刷體識別,所以,找到demo類下對應的私有方法:

我們可以看見圖片上傳有兩種方式,一種是url一種是圖片內容,url的圖片地址必須是公網可以訪問的圖片地址,本地圖片是不可以的,如果你的環境不能被外網訪問,那麼這種方法是行不通的,第二種圖片內容方式是以base64方式上傳,可以指定本地圖片,一般都是可以成功的。

所有需要改的引數到此結束,然後執行這個demo類,就可以看到識別圖片後的結果了