1. 程式人生 > >手機對話中的語音處理(三)

手機對話中的語音處理(三)

高斯 color align hidden lan scss 並不是 ria data-


本系列文章由 @YhL_Leo 出品。轉載請註明出處。
文章鏈接: http://blog.csdn.net/yhl_leo/article/details/50359479


上一篇:博客手機對話中的語音處理(二)講述了有聲語音利用LP模型進行語音合成的整個流程,本文將講述LP預測合成技術在無聲語音(即噪聲)中的使用。

2.2 30毫秒無聲語音的LP合成

從上篇博客的語音波形圖中選取一部分30毫秒的無聲語音信號(這裏選擇2000~2239這段信號):

input_frame=speech(2000:2239);
plot(input_frame);


技術分享圖片
圖 1 語音波形

繪制出其功率譜密度圖。須要強調的是,我們如今處理的是噪聲(並不是語音),所以採用平均周期頻譜來估算功率譜密度(相比一個簡單的周期頻譜而言頻率分辨率減少)。這裏使用Matlab中的pwlech函數,默認將語音幀分為8個子幀,相鄰之間重疊度為50%。

pwelch(input_frame);


技術分享圖片
圖 2 功率譜密度圖

相同使用LP模型,p=10合成一個新的幀。

合成的時候,使用all-pole濾波(使用預測殘差的標準差σ作為其標準差)處理高斯白噪聲幀:

[ai, sigma_square]=lpc(input_frame,10);
sigma=sqrt(sigma_square);
excitation
=randn(240,1); synt_frame=filter(sigma,ai,excitation); plot(synt_frame);


技術分享圖片
圖 3 合成語音波形

相同繪制出其功率譜密度圖:

pwelch(synt_frame);


技術分享圖片
圖 4 合成音功率譜密度圖

非常明顯,盡管合成音的波形與原音的波形基本沒什麽共同點,可是功率譜密度圖還有些類似。

這就是LP模型的噪聲合成分析~

手機對話中的語音處理(三)