1. 程式人生 > >數字語音訊號處理學習筆記——語音訊號的短時時域分析(2)

數字語音訊號處理學習筆記——語音訊號的短時時域分析(2)

版權宣告:本文為博主原創文章,未經博主允許不得轉載。    https://blog.csdn.net/u013538664/article/details/26068797
3.3 短時平均能量

      由於語音訊號的能量隨時間而變化,清音和濁音之間的能量差別相當顯著。因此,對短時能量和短時平均幅度進行分析,可以描述語音的這種特徵變化情況。

      定義n時刻某語音訊號的短時平均能量為:

      

      式中,N為窗長,可見短時能量為一幀樣點值的加權平方和。特殊地,當窗函式為矩形窗時,有

      

      也可以從另外一個角度來解釋。令:

      

      平均能量還可以表示為:

      

      上式可以理解為:首先語音訊號各個樣點值平方,然後通過一個衝激相應為h(n)的濾波器,輸出為由短時能量構成的時間序列:

      

      衝激響應的選擇或者說窗函式的選擇直接影響著短時能量的計算。通常N的選擇與語音的基音週期相聯絡,一般要求窗長為幾個基音週期的數量級。由於語音基音訊率範圍為50~500Hz,因此折中選擇幀長為10~20ms。

      短時平均能量的主要用途如下:

      1.可以作為區分清音和濁音的特徵引數。實驗結果表明濁音的能量明顯高於清音。通過設定一個能量門限值,可以大致判定濁音變為清音或者清音變為濁音的時刻,同時可以大致劃分濁音區間和清音區間

      2.在信噪比比較高的情況下,短時能量還可以作為區分有聲和無聲的依據

      3.可以作為輔助的特徵引數用於語音識別中

3.4 短時平均幅度函式

      短時能量的一個主要問題是對訊號電平值過於敏感。由於需要計算訊號樣值的平方和,在定點實現時很容易產生溢位。為了克服這個缺點,可以定義一個短時平均幅度函式來衡量語音幅度的變化:

      

      上式可以理解為w(n)對|x(n)|的線性濾波運算,實現框圖如下。與短時能量比較,短時平均幅度相當於用絕對值之後代替了平方和,簡化了運算。

      

3.5 短時平均過零率

      短時平均過零率是語音訊號時域分析中的一種特徵引數。它是指每幀內訊號通過零值的次數。對有時間橫軸的連續語音訊號,可以觀察到語音的時域波形通過橫軸的情況。在離散時間語音訊號情況下,如果相鄰的取樣具有不同的代數符號就稱為發生了過零,因此可以計算過零的次數。單位時間內過零的次數就稱為過零率。一段長時間內的過零率稱為平均過零率。如果是正弦訊號,其平均過零率就是訊號頻率的兩倍除以取樣頻率,而取樣頻率是固定的。因此過零率在一定程度上可以反映訊號的頻率資訊。短時平均過零率的定義為:

      

       其中,sgn[ ]為符號函式,即

       

        短時平均過零率的運算圖:

        

        短時平均過零率可以用於語音訊號請濁音的判斷。如果過零率高,語音訊號就是清音,如果過零率低,語音訊號就是濁音。但有的音,位於濁音和清音的重疊區域,這時,只根據短時平均過零率就不可能來明確地判別清、濁音。

       
--------------------- 
作者:JameJuZhang 
來源:CSDN 
原文:https://blog.csdn.net/jojozhangju/article/details/26068797 
版權宣告:本文為博主原創文章,轉載請附上博文連結!