1. 程式人生 > >數字語音訊號處理學習筆記——語音訊號的數字模型(3)

數字語音訊號處理學習筆記——語音訊號的數字模型(3)

版權宣告:本文為博主原創文章,未經博主允許不得轉載。    https://blog.csdn.net/u013538664/article/details/25219503
2.4 語音的感知

      2.4.1 幾個概念

      語音的聽覺感知是一個複雜的人腦-心理過程。對聽覺感知的研究還很不成熟。聽覺感知的試驗主要還在測試響度、音高和掩蔽效應等。人耳聽覺界限的範圍大約為20Hz~20kHz。在頻率範圍低端,感覺聲音變成低頻脈衝串,在高階感覺聲音減小直至完全聽不到一點兒聲響。語音感知的強度範圍是0~130dB聲壓級,聲音強度太高,感到難以忍受,強度太低則感到寂靜無聲。

      1.響度

      這是頻率和強度級的函式。通常用響度(單位為宋)和響度級(單位為方)來表示。

      人耳剛剛可以聽到的聲音強度,稱為“聽閾”。另外,加大聲音的強度,使聽起來令耳朵感到疼痛,這個閾值稱為“痛閾”。

      2.音高

      音高也稱基音。物理單位為赫茲,主觀感覺的音高單位是美(Mel)。  

      響度與音高之間具有互為補充的關係。

      2.4.2 掩蔽效應

      兩個響度不等的聲音作用於人耳時,則響度較高的頻率成分的存在會影響到對響度較低的頻率成分的感受,使其變的不易察覺,這種現象稱為掩蔽效應。

      2.4.3 臨界頻寬

      用一中心頻率為f,頻寬為delta-f的白噪聲來掩蔽一頻率為f的純音,先將這個白噪聲的強度調節到使被掩蔽純音恰好聽不見為止。然後將delta-f由大到小逐漸變化,而保持單位頻率的噪聲強度不變,起初這個純音一直聽不見,但當delta-f小到某個臨界值時,這個純音就突然可以聽見了。如果再進一步減小delta-f,被掩蔽音f就會越來越清晰。這裡剛剛開始能聽到的被掩蔽聲時的delta-f寬的頻帶,叫做頻率f處的臨界帶。

      2.5 語音訊號模型

      語音生成系統的傳遞函式由這個三個函式級聯而成:

      

      2.5.1 激勵模型

      發濁音時,由於聲門不斷開啟和關閉,產生間隙的脈衝。經儀器測試它類似於斜三角形的脈衝。也就是說,這時的激勵波是一個以基音週期為週期的斜三角脈衝串。

      

       在發清音的場合,聲道被阻礙形成湍流,所以可以模擬成隨機白噪聲。

       2.5.2 聲道模型

       典型的聲道模型有兩種,即無損聲管模型和共振峰模型。

       2.5.3 輻射模型

       從聲道模型輸出的是速度波,而語音訊號是聲壓波。二者的倒比稱為輻射阻抗,它表徵口脣的輻射效應。

       2.6 語音訊號數字模型

       
--------------------- 
作者:JameJuZhang 
來源:CSDN 
原文:https://blog.csdn.net/jojozhangju/article/details/25219503 
版權宣告:本文為博主原創文章,轉載請附上博文連結!