語音合成和語音識別

阿新 • • 發佈：2018-11-26

1、語音合成

　　　　預先準備工作：

　　　　安裝所需的依賴包

　　　　1：pip install baidu-aip

　　　　2：百度雲建立語音合成專案，https://ai.baidu.com/

 1 from aip import AipSpeech
 2 
 3 """ 你的 APPID AK SK """
 4 APP_ID = '14940739'
 5 API_KEY = 'xCnr5K8ESsmOVaA5bl5ot5QY'
 6 SECRET_KEY = '4wH7W92hPUp8V7ogY4BZzV2pcZ3nC8LH '
 7 
 8 
 client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
 9 
10 
11 result  = client.synthesis('你好百度', 'zh', 1, {
12     'vol': 5,
13     'per':5
14 })
15 
16 # 識別正確返回語音二進位制 錯誤則返回dict 參照下面錯誤碼
17 if not isinstance(result, dict):
18     with open('auido.mp3', 'wb') as f:
19         f.write(result)

程式碼例項

2、語音識別

　　預先準備工作：

　　1安裝轉碼工具　　

　　1.FFmpeg:

　　連結：https://pan.baidu.com/s/1jonSAa_TG2XuaJEy3iTmHg

　　密碼：w6hk

　　轉碼命令：ffmpeg -y -i audio.wav -acodec pcm_s16le -f s16le -ac 1 -ar 16000 audio.pcm

 1 from aip import AipSpeech
 2 import  os
 3 """ 你的 APPID AK SK """
 4 APP_ID = ' 
14940739'
 5 API_KEY = 'xCnr5K8ESsmOVaA5bl5ot5QY'
 6 SECRET_KEY = '4wH7W92hPUp8V7ogY4BZzV2pcZ3nC8LH '
 7 
 8 client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
 9 
10 # contemp=f"ffmpeg -y  -i audio.wav  -acodec pcm_s16le -f s16le -ac 1 -ar 16000 audio.pcm"
11 
12 # 讀取檔案
13 def get_file_content(filePath):
14     os.system(f"ffmpeg -y  -i {filePath}  -acodec pcm_s16le -f s16le -ac 1 -ar 16000 {filePath}.pcm")
15     with open(f"{filePath}.pcm", 'rb') as fp:
16         return fp.read()
17 
18 # 識別本地檔案
19 res=client.asr(get_file_content('auido.mp3'), 'pcm', 16000, {
20     'dev_pid': 1536,
21 })
22 print(res.get("result")[0])

程式碼例項

3、語音對話

 1 from aip import AipSpeech
 2 import os
 3 """ 你的 APPID AK SK """
 4 APP_ID = '14940739'
 5 API_KEY = 'xCnr5K8ESsmOVaA5bl5ot5QY'
 6 SECRET_KEY = '4wH7W92hPUp8V7ogY4BZzV2pcZ3nC8LH '
 7 
 8 client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
 9 
10 def get_file_content(filename):
11     # os.system(f"ffmpeg -y  -i {filename}  -acodec pcm_s16le -f s16le -ac 1 -ar 16000 {filename}.pcm")
12     # with open(f"{filename}.pcm", 'rb') as fp:
13     with open("sd.pcm", 'rb') as fp:
14         res = client.asr(fp.read(), 'pcm', 16000, {
15             'dev_pid': 1536,
16         })
17         return  res.get("result")[0]
18 
19 def  synthesis(text):
20     result = client.synthesis(text, 'zh', 1, {
21         "spd": 4,
22         'vol': 5,
23         "pit": 8,
24         "per": 4
25     })
26 
27     # 識別正確返回語音二進位制 錯誤則返回dict 參照下面錯誤碼
28     if not isinstance(result, dict):
29         with open('auido.mp3', 'wb') as f:
30             f.write(result)
31     os.system("auido.mp3")
32 
33 text=get_file_content("auido.mp3")
34 if "傻屌" in text:
35     synthesis("我挺好的")
36 else:
37     synthesis(f"你剛才是不是說,{text}")

程式碼例項

語音合成和語音識別

1、語音合成　　　　預先準備工作：　　　　安裝所需的依賴包　　　　1：pip install baidu-aip 　　　　2：百度雲建立語音合成專案，https://ai.baidu.com/ 　　 1 from aip import AipSpeech

Python人工智慧第一篇：語音合成和語音識別

Python人工智慧第一篇：語音合成和語音識別此篇是人工智慧應用的重點,只用現成的技術不做底層演算法,也是讓初級程式設計師快速進入人工智慧行業的捷徑。目前市面上主流的AI技術提供公司有很多,比如百度,阿里,騰訊,主做語音的科大訊飛,做只能問答的圖靈機器人等等。這些公司投入了很大一部分財力物力人力將底層封

科大訊飛（語音合成和語音聽寫）

由於google的自帶的TTS不支援中文轉語音。所以很無奈的只能選擇語音龍頭中的科大訊飛了本文章只是簡單的實現語音合成和語音聽寫 package com.example.viocedemo; import com.iflytek.cloud.speech.Rec

關於語音合成和識別

沒有 asr 進制 lower 編碼 IV 業務 key -i 最近研究了下語音合成和語音識別。分別看了一些文章，也下載jdk寫了些代碼測試了下。發現，對於語音合成。中文來說，百度語音和科大訊飛，基本都差不多。英文的話，百度合成出來的效果不佳。科大訊飛稍好點。但是總體都

語音合成和識別介面

第一步：匯入jar包再libs資料夾，匯入Msc.jar和Sunflower.jar，還有so包（這個要看手機是什麼晶片）。第二步：程式碼 MainActivity: package com.example.speechtest2; imp

百度語音合成與語音識別api使用（Java版本）

百度語音合成與語音識別api使用（Java版本）百度語音合成官方文件：https://ai.baidu.com/docs#/TTS-Online-Java-SDK/top 百度語音識別官方文件：https://ai.baidu.com/docs#/ASR-Online-

Winform利用訊飛語音WebAPI實現線上語音合成、語音識別

閒來無事做的一個demo。本來想做成網站的形式，發現不知道怎麼在請求頭裡加資訊，於是就做成了Winform版的。去官網開通sdk 沒註冊的先要註冊，然後建立應用，應用平臺選擇webAPI 回到控制檯，新增新服務--線上語音合成、語音聽寫新增IP

語音合成以及語音識別

AI開放平臺:http://ai.baidu.com/ 圖靈機器人:http://www.tuling123.com/ 語音合成以及語音識別: hecheng.py # 圖靈機器人 import requests url = "http://openapi.tulin

Python實現語音識別和語音合成

聲音的本質是震動，震動的本質是位移關於時間的函式，波形檔案(.wav)中記錄了不同取樣時刻的位移。通過傅立葉變換，可以將時間域的聲音函式分解為一系列不同頻率的正弦函式的疊加，通過頻率譜線的特殊分佈，建立音訊內容和文字的對應關係，以此作為模型訓練的基礎。案例：畫出語音訊號的波形和頻率分佈，（freq.w

樹莓派學習——語音識別和語音朗讀

百度 fpm url .com http 樹莓派 .net method ech 語音識別是基於百度語音REST aip-python-sdk-1.6.0，樹莓派上已安裝pycurl，mplayer。 1：註冊賬號，獲取token 2：提交語音相關信息 3：處理返回的Jso

人工智能-語音合成-語音識別

AC app appid document pre aip instance class OS 圖靈機器人： http://www.tuling123.com 百度開發平臺： http://ai.baidu.com/ 下載 baidu-ap

unity 對接訊飛window平臺語音識別，語音合成記錄

最近記性越來越差，必須得把踩過的坑寫下來，防止重複踩坑的出現。主要參考了部落格：https://blog.csdn.net/qq_39993352/article/details/80545422和語音識別的案例原始碼：https://github.com/3wz/IFlySDKForUn

語音合成論文和英偉達撞車，韓國小哥緊急放出全部草稿程式碼和樣本 | 資源帖...

曉查發自凹非寺量子位報道 | 公眾號 QbitAI 由於和英偉達研究撞車，韓國一位研究語音合成的作者已經哭暈了。 10月31日，英偉達在arXiv網站上傳了一篇論文——WaveFlow：一個用於音訊合成基於流的生成網路。英偉達論文地址：https://arxi

語音識別語音合成

本節內容預備資料: 1.FFmpeg: 連結：https://pan.baidu.com/s/1jonSAa_TG2XuaJEy3iTmHg 密碼：w6hk 2.baidu-aip: pip install baidu-aip 終於進入主題了,此篇是人工智慧應用的

python實現人工智慧之路--語音識別加語音合成

程式碼如下 from aip import AipSpeech import os APP_ID = '14940732' API_KEY = 'tm1jAzv8dnDQM5yzFUk0ED9j' SECRET_KEY = '2WsPOg8k7GHtPnN2PBIsuf9L

python實現人工智能之路--語音識別加語音合成

name lap ons nsa aud str play text not 代碼如下 from aip import AipSpeech import os APP_ID = ‘14940732‘ API_KEY = ‘tm1jAzv8dnDQM5yz

基於python+opencv+pyqt5+百度AI實現的人臉識別、語音播報、語音合成、模擬簽到系統（1）

人臉識別效果圖簡單介紹使用python3+寫的，使用face_recognition（python開源的人臉識別庫）進行人臉識別，使用opencv2進行開啟顯示攝像頭圖片等，使用pyqt5是ui介面，使用百度AI中的百度語音合成實現語音播報和語音合成，

python人臉識別、語音合成、智慧簽到系統（2）

基於python+face_recognition+opencv+pyqt5+百度AI實現的人臉識別、語音播報、語音合成、模擬簽到系統（2）人臉識別效果圖功能介紹檔案 ft2.py (對漢字實現轉碼opencv的puttxt不支援漢字需要轉碼)

百度雲實現語音識別及語音合成

第一步，點選人工智慧，語音合成，然後立即使用：然後再應用列表裡面建立應用：檢視技術文件，下面附上我的語音合成及識別的程式碼： from aip import AipSpeech """ 你的 APPID AK SK """ APP_ID = '1507967

如何給自己的微信機器人新增語音識別和文字識別的功能

前言：這是我幾個月前一邊工作，一邊搗鼓的個人專案，一直沒有時間去寫點總結，也許是我這個人比較懶吧，不然也不會做出這種東西，哈哈哈。記得那時閒來無事，自己又有許多奇思異想，由於自己之前使用itchat做了個可以接管微信的聊天機器人，我就想能不能給自己的機器人加一些

語音合成和語音識別

相關推薦