1. 程式人生 > >音色與聲譜圖

音色與聲譜圖

泛音的種類和多少決定了音色

為什麼有的人聲音聽起來暗,有的人聽起來亮?事實上即使是唱同一個音高,大家的音色也天差地別,差別就在泛音上了。

一般來說

1. 泛音越充分的聲音越飽滿。

2. 低頻泛音越充分的聲音聽起來越“厚實”,越“有力”。

3. 高頻泛音越充分的聲音穿透力越強,聲音聽起來越“亮”,越“尖”。

4. 高低頻都有並且合理分佈的聲音,就是比較完美的聲音。

聲樂理論裡,一般把低頻泛音叫低位置共鳴,高頻泛音叫高位置共鳴。

頻譜圖/聲譜圖

頻譜圖/聲譜圖是觀察泛音的最好辦法。

相信看了第一章的頻譜圖演示,應該已經很清楚頻譜圖的含義了

頻譜圖就是描述在某一時間點上,各個頻率的聲音分佈情況。這張圖自己就解釋的很清楚了吧~

然而,頻譜圖只能描述某一時間點,不能表達一段時間的情況,所以把頻譜連續的畫到一張圖裡,就有了聲譜圖(這個翻譯有點蛋疼)。

此圖由兩部分組成,上半部分為聲譜圖(Spectrogram),下半部分為頻譜圖(Spectrum)。

先看上圖:

橫座標是時間,縱座標是頻率值,同一時間的縱線上存在著數個波,重合而成最終的波。顏色越亮則表示波的振幅越大。混亂的背景都是伴奏,我們只觀察人聲線。

再看下圖:

下圖反映了上圖的某個時間點(上圖中的黃線)的頻率分佈。橫座標為頻率,縱座標為振幅。這個圖更有利於直觀的觀察泛音的成分和強弱。

頻譜/聲譜圖是如何製作的

此段很學術,沒興趣的可以略過。

我們都知道原始的聲音是波形圖,不過原始的波形圖並沒有太大研究價值,而且事實上也看不出“波形”。因為震動頻率太高,比如帕瓦羅蒂的high c吧,500多的震動頻率,表示一秒鐘要震動500多次,那肯定是看上去一大坨,類似這樣:

放大幾十倍之後,大約能看出波形,類似這樣

無論哪種都不適合研究。

所以音訊解析的過程是:取連續取樣點,一般是4096個點,考慮到音訊檔案的取樣率一般是44.1k,所以就是取了1/10秒之內的資料。然後對這4096個點作做快速傅立葉變換,就得到了頻譜圖。頻譜圖的資訊是4096個點,每一個點對應的是這個頻率上的振幅。

頻譜圖反應的是在這個時間點上的頻率分佈情況。

嚴格的說應該是這1/10秒內的平均情況。

來一張典型頻譜圖,看看跟我的圖下部是不是一回事:

將當前時間點的頻譜畫到聲譜圖裡就得到了瀑布圖(第二章視訊中的圖)。畫法是:振幅越大的點,用越亮的顏色。

縱座標是頻率,從下到上大約是0到6000。

所以一個人唱了個C5,那他的基頻就大概是500,第一泛音是1000,第二泛音是1500,畫到聲譜圖上的結果就是從下到上每隔500畫一個點,根據振幅有顏色的區別。

隨著時間的推移,聲譜圖會不斷向右延伸,這樣我們就得到了一段時間內頻率分佈圖。比如一個C5的線在聲譜圖上水平延續了5秒,那表示該歌手唱了C5五秒。

聲譜圖上類似“波”的東西是顫音,也就是歌手演唱中不斷改變音高,所以自然會不斷改變縱座標。

來一張wiki的聲譜圖:

最後,頻譜圖/聲譜圖的wiki連結

連結出處

聲譜圖上出現的水平線有什麼意義?

水平線表示一個歌手在某個音高上持續了一段時間。越亮的線表示振幅越大,聽感上當然就音量大了。

直線就是一個長直音。考察長直音主要看穩定度,整個線越直則這個長音越穩,如果大抖就是破音,如果小抖就是不穩。如果歪了,那就是音準沒把握好。

波浪線就是顫音。波浪越大則顫音越大。看顫音也是看穩定度,如果顫的不穩就是氣息出現問題,控制不好。

如何看共鳴?

看泛音主要看三點:豐富與否;分佈情況;泛音的音量。

點看全圖

一般來說,所謂的泛音強弱都是和自己的基頻來比的(或者是跟伴奏比)。因為音訊檔案的音量是可以調的,單純看泛音大小沒多大意義,以基頻為參照才比較有實際意義。(低頻的共鳴情況取決於母音的型別,每一個母音都有其特定的共鳴特性。一般來說,基頻被共鳴強化的情況比較少。)

可以看到,此例中第一泛音巨大(看多了就知道,一般都是第一泛音最大),在3000左右的三個泛音也很強。

另一種觀察方法就是和伴奏比,人聲線越明顯則人聲越強,越能穿透伴奏。

如上圖,左邊張雨生的人聲線顯然更明顯。右邊那英的線就不明顯多了,混在伴奏裡。

再來看另一個例子

後知後覺對比版

http://v.youku.com/v_show/id_XNjI1NTAxMzQ4.html

點看全圖

張雨生後知後覺清唱“你不辭冰雪”,竟然有如此大的高頻泛音!

要知道,這可是清唱,中音區!唱高音的時候鼓足了氣,有很大的共鳴很正常,但唱低緩的主歌,竟然也能爆出這麼大的泛音!只能說寶哥太逆天!

下面,請出阿妹躺槍:

點看全圖

(圖中豎線為背景音,就是那個類似指響的聲音)

泛音少太多了。。。。

聽感上也是很顯然的,阿妹的音色暗的多,而寶哥的非常的清亮。

當然,必須要說明:寶哥佔了cd版的優勢。不過我們關注的是最終聽感,聲音經過怎麼處理並不是我們關注的重點。這個例子很好的對比了泛音對音色的影響。

如何看音準?

我的軟體特別加了標準音高線,以及標準的泛音線,所以可以很清楚的看清音準:

點看全圖

藍色標準線比較暗,大家仔細看。。(太亮的話會干擾聲音線)

下面有請躺槍天后阿妹展示一下音準不好是什麼樣的:

點看全圖

很明顯,比E5高,越到高頻差得越遠。(高頻會放大差值)

點看全圖

提高1key看看,又低了。這次差得更遠。

所以可以判定,阿妹唱到了E5 . 5。

再看幾個例子

點看全圖

帕瓦羅蒂大師,堪稱全頻段制霸了。大家都知道帕瓦羅蒂的C5是無敵的。

點看全圖

磊叔傳說中的五百年。也差不多全頻段制霸了。

多說兩句:

上面的例子看的很明顯吧,人聲基本都本著標準的

基頻/第一泛音(基頻的二倍)/第二泛音(基頻的三倍)/….

來的。自然界物體振動發聲,絕大多數都是這樣的。

如何自己看圖?

對不起,我的軟體不能外傳,因為一旦落入別有用心的人手裡,後果堪憂,比如這個http://tieba.baidu.com/p/2795531384

想自己看圖最方便的是foobar:

通過點選 View(檢視) > Visualizations(視覺化) > Spectrogram(聲譜)

可以調出聲譜view,再播放音樂的時候,聲譜就會即時出現了。

類似的,Spectrum就是頻譜圖。

或者Spectrogram這個軟體也不錯。

對我有質疑的話,可以用如上的辦法自己看圖,看看跟我的圖是不是一樣。