1. 程式人生 > >MP3的取樣率和位元率

MP3的取樣率和位元率

  我們聽mp3,看電影都會注意到兩個引數,常見的有采樣率44.1KHz,位元率192Kbps,那麼什麼是取樣率,什麼是位元率?他們是什麼關係呢?下面就我們就來簡單做個解釋:
  把模擬音訊訊號轉成數字音訊訊號的過程稱作取樣,簡單地說就是通過波形取樣的方法記錄1秒鐘長度的聲音,需要多少個數據點。eg:44.1KHz取樣率的聲音就是要花費44000個數據點來描述1秒鐘的聲音波形。原則上取樣率越高,聲音質量越好;取樣頻率一般共分為22.05KHz、44.1KHz、48KHz三個等級;22.05 KHz只能達到FM廣播的聲音品質,44.1KHz則是理論上的CD音質界限,48KHz則已達到DVD音質了。
  取樣率是指將聲音(模擬訊號)轉換成mp3(數字訊號)時的取樣頻率,也就是單位時間內取樣多少點資料。(一個取樣點資料有8(甚至更多)個位元。)


  位元率是指每秒傳送的位元(bit)數。單位為 bps(Bit Per Second),位元率越高,傳送的資料越大,音質越好。

  可以這樣講,取樣率和位元率就像是座標軸上的橫縱座標。橫座標的取樣率表示了每秒鐘的取樣資料點。縱座標的位元率表示了用數字量來量化模擬量的時候的精度。

  取樣率類似於動態影像的幀數,比如電影的取樣率是24赫茲,PAL制式的取樣率是25赫茲,NTSC制式的取樣率是30赫茲。當我們把取樣到的一個個靜止畫面再以取樣率同樣的速度回放時,看到的就是連續的畫面。同樣的道理,把以44.1kHZ取樣率記錄的CD以同樣的速率播放時,就能聽到連續的聲音。顯然,這個取樣率越高,聽到的聲音和看到的影象就越連貫。[當然,人的聽覺和視覺器官能分辨的取樣率是有限的,基本上高於44.1kHZ取樣的聲音,絕大部分人已經覺察不到其中的分別了。]

  而聲音的位數相當於畫面的顏色數,表示每個取樣的資料量,當然資料量越大,回放的聲音越準確,不至於把開水壺的叫聲和火車的鳴笛混淆。同樣的道理,對於畫面來說就是更清晰和準確,不至於把血和西紅柿醬混淆。[不過受人的器官的機能限制,16位的聲音和24位的畫面基本已經是普通人類的極限了,更高位數就只能靠儀器才能分辨出來了。比如電話就是3kHZ取樣的7位聲音,而CD是44.1kHZ取樣的16位聲音,所以CD就比電話更清楚。]

  當你理解了以上這兩個概念,位元率就很容易理解了。以電話為例,每秒3000點取樣,每個取樣是7位元,那麼電話的位元率是21000。而CD是每秒44100點取樣,兩個聲道,每個取樣是13位PCM編碼,所以CD的位元率是44100*2*13=1146600,也就是說CD每秒的資料量大約是144KB,而一張CD的容量是74分等於4440秒,就是639360KB=640MB。

備註:

  MPEG 1 Layer 3是常見的MP3編碼的音訊檔案,而所謂的MPEG 2 Layer 3其實只是22050HZ取樣率的MP3,MPEG 2.5 Layer 3也是採用更底取樣率的MP3。所以,MPEG 2 Layer 3、MPEG 2.5 Layer 3根本沒有采用44100HZ或48000HZ取樣率。由於取樣率的偏底,所以MPEG 2 Layer 3、MPEG 2.5 Layer 3音質應該不會比MPEG 1 Layer 3的音質好。