手機對話中的語音處理(三)
阿新 • • 發佈:2018-01-21
高斯 color align hidden lan scss 並不是 ria data-
本系列文章由 @YhL_Leo 出品。轉載請註明出處。
文章鏈接: http://blog.csdn.net/yhl_leo/article/details/50359479
圖 1 語音波形
圖 2 功率譜密度圖
圖 3 合成語音波形
圖 4 合成音功率譜密度圖
本系列文章由 @YhL_Leo 出品。轉載請註明出處。
文章鏈接: http://blog.csdn.net/yhl_leo/article/details/50359479
上一篇:博客手機對話中的語音處理(二)講述了有聲語音利用LP模型進行語音合成的整個流程,本文將講述LP預測合成技術在無聲語音(即噪聲)中的使用。
2.2 30毫秒無聲語音的LP合成
從上篇博客的語音波形圖中選取一部分30毫秒的無聲語音信號(這裏選擇2000~2239這段信號):
input_frame=speech(2000:2239);
plot(input_frame);
圖 1 語音波形
繪制出其功率譜密度圖。須要強調的是,我們如今處理的是噪聲(並不是語音),所以採用平均周期頻譜來估算功率譜密度(相比一個簡單的周期頻譜而言頻率分辨率減少)。這裏使用Matlab中的pwlech
函數,默認將語音幀分為8個子幀,相鄰之間重疊度為50%。
pwelch(input_frame);
圖 2 功率譜密度圖
相同使用LP模型,
合成的時候,使用all-pole
濾波(使用預測殘差的標準差
[ai, sigma_square]=lpc(input_frame,10);
sigma=sqrt(sigma_square);
excitation =randn(240,1);
synt_frame=filter(sigma,ai,excitation);
plot(synt_frame);
圖 3 合成語音波形
相同繪制出其功率譜密度圖:
pwelch(synt_frame);
圖 4 合成音功率譜密度圖
非常明顯,盡管合成音的波形與原音的波形基本沒什麽共同點,可是功率譜密度圖還有些類似。
這就是LP模型的噪聲合成分析~
手機對話中的語音處理(三)