1. 程式人生 > >騰訊文智自然語言處理介紹與情感分析API呼叫

騰訊文智自然語言處理介紹與情感分析API呼叫

一.產品概述

文智中文語義開放平臺是基於平行計算系統和分散式爬蟲平臺,結合獨特的語義分析技術,一站式滿足使用者NLP、轉碼、抽取、全網資料抓取等中文語義分析需求的開放平臺。使用者能夠基於平臺對外提供的OpenAPI實現搜尋、推薦、輿情、挖掘等語義分析應用

騰訊雲文智中文語義平臺以SDK模組方式提供服務,支援多種程式語言

二.產品功能

Action id查詢:https://cloud.tencent.com/document/product/271/2050

1.分詞/命名實體識別API,提供智慧分詞(基本詞+短語)、詞性標註、命名實體識別功能。Action id=LexicalAnalysis

2.情感分析API,對資訊進行情感上的正向、負向及中性進行評價,Action id=TextSentiment

3.主題分類API,提供自動文字分類服務,目前平臺能識別的類別包括招聘、影視、音樂、健康養生、財經、廣告推廣、犯罪、政治等90多個類別

4.關鍵詞提取API,基於關鍵詞抽取平臺,為使用者實現如新聞內容關鍵詞自動提取、評論關鍵詞提取等提供基礎服務。支援自定義詞典

5.敏感資訊識別API

6.句法分析API,句法分析出句子中詞與詞間的關係,可用於提取句子主幹、核心詞等。句法分析可更好的理解句子,在機器翻譯、自動問答、知識抽取等領域均可應用

7.同義詞API

8.糾錯API,實現對短文字的自動糾錯功能,使用者只需提供業務資料和日誌

9.轉碼API,網頁轉碼和網頁名片,網頁轉碼是將PC機上展示的二維頁面轉換成移動端裝置上展示的一維頁面。網頁名片是將頁面簡化為主體圖片、標題和摘要的組合,以卡片形式展示,適合做頁面分享、收藏和推廣。使用者只需要提交網頁url

10.下載抽取API,基於分散式爬蟲系統,使用者提供url即可完成資料抓取。分散式爬蟲系統通過對全網url進行精準排程、智慧壓力挖掘、自適應頁面更新週期預測,可實現自動路由、url作弊識別、智慧主題抓取等功能

7.3.API呼叫

1.API請求結構

域名訪問地址:wenzhi.api.qcloud.com

通訊協議:HTTPS

請求方法:POST\GET均可,一般使用GET

字元編碼:utf-8

名稱

描述

備註

API入口

API呼叫WebService入口

https://wenzhi.api.qcloud.com/v2/index.php

公共引數

每個介面都包含的通用引數

詳見3.公共引數

指令名稱

API要執行的指令的名稱,這裡使用Action指定,如Action=LexicalAnalysis

完整的指令請參見 API查詢

指令引數

每個特定指令需要的引數

見每個指令的文智介面文件

2.介面鑑權-演算法在相應的py檔案中

騰訊雲控制檯->雲產品->管理工具->雲API金鑰

新建金鑰,建立一對Secretld/SecretKey

3.公共引數

名稱

型別

描述

必選

Action

String

介面指令的名稱,例 LexicalAnalysis

Region

String

區域引數,用來標識希望操作哪個區域的例項。可選: bj:北京;gz:廣州;sh:上海;hk:香港;ca:北美

Timestamp

UInt

當前UNIX時間戳

Nonce

UInt

隨機正整數,與 Timestamp 聯合起來, 用於防止重放攻擊

SecretId

String

騰訊雲平臺上申請的標識身份的SecretId 和SecretKey,其中SecretKey會用來生成 Signature

Signature

String

請求籤名,用來驗證此次請求的合法性

 錯誤碼含義查詢:

https://cloud.tencent.com/document/product/271/2057

四.情感分析

情感分析用於判斷情感傾向,在輿情監控、話題監督、口碑分析等商業分析領域有非常重要的應用價值

1.介面描述

域名:wenzhi.api.qcloud.com 介面名: TextSentiment

2. 輸入引數

引數名稱

必選

型別

描述

content

String

待分析的文字(只能為utf8編碼)

type

Int

(可選引數,預設為4) 1:電商;2:APP;3:美食;4:酒店和其他

3. 輸出引數

引數名稱

型別

描述

code

Int32

錯誤碼,0:成功,其他值:失敗

message

String

錯誤資訊

positive

Double

正面情感概率

negative

Double

負面情感概率

#qcloudapi-sdk-python SDK工具包
#安裝
pip install qcloudapi-sdk-python

#情感分析API呼叫
#Python 3.6
from QcloudApi.qcloudapi import QcloudApi
# 設定需要載入的模組
module = 'wenzhi'
# 介面名-情感分析
action = 'TextSentiment'
# 雲API的公共引數-引數排序很重要(首字母排序)
config = {
    'method': 'GET',
    'Region': 'ap-guangzhou',
    'secretId': '替換成自己的',
    'secretKey': '替換成自己的',
    'SignatureMethod': 'HmacSHA1'
   }
# 請求引數,支援json
# 陣列'content':[1,2,3]
params = {'content':'是真的煩人','type':4}

service = QcloudApi(module, config)
#請求前修改引數(5個引數均可修改)
#service.setRegion('ap-shanghai')

# 生成請求的url,但不發起請求
print(service.generateUrl(action, params))
# 呼叫介面-發起請求
s=service.call(action, params)
print(s)

#輸出
b'{"code":0,"message":"","codeDesc":"Success","positive":0.35916191339493,"negative":0.64083808660507}'