1. 程式人生 > >數字語音訊號處理學習筆記——語音訊號的數字模型(1)

數字語音訊號處理學習筆記——語音訊號的數字模型(1)

版權宣告:本文為博主原創文章,未經博主允許不得轉載。    https://blog.csdn.net/u013538664/article/details/25110285
2.1 概述

            為了用數字訊號處理方法對語音訊號進行處理,首先需要建立語音訊號產生的數字模型,因此,我們必須在對人的發聲器官和發聲機理進行研究的基礎上,才能建立精確的模型。但是,由於人類語音產生過程的複雜性和語音資訊的豐富性以及多樣性,迄今為止還沒有找到一種能夠精確描述語音產生過程和所有特徵的理想模型。

        作為接受語音資訊的人耳聽覺系統,其聽覺機理也是很複雜的。聽覺模型的精確建立對於語音識別和理解是非常重要的,但是,目前人們對聽覺機理的瞭解比對發音機理的瞭解少得多。

2.2 語音的發聲機理

        2.2.1 人的發聲器官

       

       人的發生器官由三部分組成:

       1) 肺和氣管產生氣源 

           肺的發聲功能主要是產生壓縮氣體,通過氣管傳送到聲音生成系統。氣管連線著肺和喉,它是肺與聲道聯絡的            通道。

       2) 喉和聲帶組成聲門

           喉是控制聲帶運動的軟骨和肌肉的複雜系統,它主要包括:環狀軟骨、甲狀軟骨、杓狀軟骨和聲帶。其中聲帶            是重要的發聲器官,它是伸展在喉前、後端之間的槢肉。

           

       3) 由咽喉、口腔、鼻腔組成聲道

           聲道是指聲門至嘴脣的所有發音器官:

           

       其中包括:咽喉、口腔和鼻腔。口腔包括上下脣、上下齒、上下齒齦、上下齶、舌和小舌等部分。上齶又分為硬齶和軟齶兩部分;舌又分為舌尖、舌面和舌根三部分。鼻腔在口腔上面,靠軟齶和小舌將其與空腔隔開。當小舌下垂時,鼻腔和口腔便耦合起來,當小舌上擡時,口腔與鼻腔是不相通的。口腔和鼻腔都是發聲時的共鳴器。聲道可以看成一根從聲門一直延伸到嘴脣的具有非均勻截面的聲管,其截面積主要取決於脣、舌、齶和小舌的形狀和位置,最小橫截面積可以為零(對應於完全閉合的部位),最大截面積可以達到約20平方釐米。

        2.2.2 語音生成

        空氣由肺部排入喉部,經過聲帶進入聲道,最後由嘴輻射出聲波,這就形成了語音。在聲門(聲帶)以左,稱為“聲門子系統”,它負責產生激勵振動;右邊是“聲道系統”和“輻射系統”。當發不同性質的語音時,激勵和聲道的情況是不同的,它對應的模型也是不同的。

        1) 發濁音的情況

        空氣流經過聲帶時,如果聲帶是繃緊的,則聲帶將產生張弛振動,即聲帶將週期性地啟開和閉合。聲帶啟開時,空氣流從聲門噴射出來,形成一個脈衝,聲帶閉合時相應於脈衝序列的間隙期。因此,這種情況下在聲門處產生出一個準週期脈衝狀的空氣流。這個準週期脈衝的週期即為基音週期。因此,基因頻率是由聲帶張開閉合的週期所決定的。男性的基音訊率一般為50~250Hz,女性的基音訊率為100~500Hz。

       2) 發清音的情況

        空氣流經過聲帶時,如果聲帶是完全舒展開的,則肺部發出的空氣流將不受影響地通過聲門。空氣流通過聲門後,會遇到兩種不同的情況。一種情況是,如果聲道的某個部位發生收縮形成一個狹窄的通道,當空氣流到達此處時被迫以高速衝過收縮區,並在附近產生出空氣湍流,這種湍流空氣通過聲道後便形成所謂摩擦音或清音。另一種情況是,如果聲道的某個部位完全閉合在一起,當空氣流到達時便在此處建立空氣壓力,閉合點突然開啟便會讓氣壓快速釋放,經過聲道後便形成所謂爆破音。這兩種情況下發出的音稱為清音。

        當聲音產生後,便沿著聲道進行傳播。聲道可以看成一根具有非均勻截面的聲管,在發聲時起著共鳴器的作用。聲音進入聲道後,其頻率必定會受到聲道的共振特性的影響,聲道具有一組共振頻率,稱為共振峰頻率或共振峰。聲道的頻譜特性便主要地反映出這些共振峰的不同位置以及各個峰的頻頻寬度。共振峰及其頻寬取決於聲道的形狀和尺寸,因而不同的語音對應於一組不同的共振峰引數。


--------------------- 
作者:JameJuZhang 
來源:CSDN 
原文:https://blog.csdn.net/jojozhangju/article/details/25110285 
版權宣告:本文為博主原創文章,轉載請附上博文連結!