1. 程式人生 > >AMR音訊編碼器概述及檔案格式分析

AMR音訊編碼器概述及檔案格式分析

全稱Adaptive Multi-Rate,自適應多速率編碼,主要用於移動裝置的音訊,壓縮比比較大,但相對其他的壓縮格式質量比較差,由於多用於人聲,通話,效果還是很不錯的。AMR-WB應用於EDGE、3G可充分體現其優勢。足夠的傳輸頻寬保證AMR-WB可採用從6.6kb/s到23.85kb/s共九種編

網上有些分析AMR NB 和AMR WB區別的資料,為節省篇幅,就不一一轉過來了,可以參考如下

不過我感覺這些對比都是對比的表面現象,沒有對比AMR NB和AMR WB的本質不同,AMR NB和AMR WB語音編解碼都是使用的是多位元速率寬頻代數碼激勵線性預測ACELP(Algebraic Code Excitation Linear Prediction)。


AMR NB的語音頻寬範圍:300-3400Hz,8KHz取樣
AMR WB的語音頻寬範圍: 50-7000Hz,16KHz取樣
AMR-WB+的取樣速率是在16~48 kHz之間。這使得它的語音頻寬更寬(24 kHz)

AMR WB與AMR NB的不同之處在於AMR WB在16k取樣率的運作,兩個頻率帶50~6400Hz 和6400~7000Hz 進行編碼,用來降低複雜度,將位演算法集中到更重要的頻率區。低頻帶使用ACELP演算法進行編碼。 新增幾個特徵來達到一個高的主觀質量。 線性預測(LP)演算法是在每隔20ms 的幀要進行一次線性預測演算法,每5ms搜尋一次自適應碼本。這個過程是在12.8Kbs 速率下進行的.高頻帶是在解碼器端使用低帶和隨機激勵的引數重建的, 目的是調整與在聲音基礎上的低頻有關的高
頻帶. 高頻帶的聲頻通過使用由低帶LP 過濾器產生的LP 濾波器進行重建.

下面來看看AMR WB+,AMR WB+不像現有編碼器僅採用單一演算法,而是對處理語音和音效分別採用ACELP(Algebraic Code Excited Linear Prediction)編碼技術和變換碼激勵(TCX)編碼技術,這種混合模式能提供比AMR WB同更好的音訊質量。
對於單聲道編碼, AMR WB+採用混合的ACELP/TCX編碼模型。AMR WB+編解碼器能接受單聲道或立體聲的輸入訊號,取樣頻率在16~48 kHz之間。單聲道訊號可分解成2個頻帶:一個是低頻訊號,取樣率低至12.8 kHz,即AMR WB的內部頻率;另一個則是高頻訊號,含有6.4 kHz以上的所有頻率。混合的ACELP/ TCX編碼模型應用於低頻訊號,並利用一種頻寬延伸(BWE)法對高頻訊號進行編碼,擷取出能代表頻譜封包與增益的引數,訊號經過量化後再傳送至解碼器。解碼器會使用外推法求算出高頻訊號的結構。每個子幀都進行增益校正與運算,然後再進行傳輸,藉此確保低頻帶與高頻帶之間6.4 kHz銜接處的連續性。由於只傳輸少量的引數,因此BWE總位元率僅有0.8 Kb/s。
對於立體聲編碼,AMR WB+立體聲編碼和單聲道編碼一樣會分割頻帶。低頻帶立體聲訊號編碼採用一套新的半引數技術。兩個聲道經過壓縮混合後形成一個單聲道訊號,再用上述的AMR—WB+核心編解碼器進行編碼。高頻帶部分(6.4 kHz以上)則在兩個立體聲聲道上運用引數型BWE進行編碼,這與對單聲道訊號的高頻部分進行編碼是一樣的。編解碼器能在6~48 Kb/s的位元率下運作,並能在更高的頻率中支援所有可聽的頻譜。有別於在7 kHz頻帶下運作的AMR WB,AMR WB+能將編碼頻寬延伸至19 kHz。因此即使在語音訊號上亦能發揮超越AMR WB的效能(AMR WB頻寬14 kHz)。

相關推薦

AMR音訊編碼概述檔案格式分析

全稱Adaptive Multi-Rate,自適應多速率編碼,主要用於移動裝置的音訊,壓縮比比較大,但相對其他的壓縮格式質量比較差,由於多用於人聲,通話,效果還是很不錯的。AMR-WB應用於EDGE、3G可充分體現其優勢。足夠的傳輸頻寬保證AMR-WB可採用從6.6kb/s到23.85kb/s共九種編 網

hive:資料型別檔案格式

Hive的資料型別     Hive 提供了基本資料型別和複雜資料型別 1.1 原始資料型別 整型 TINYINT — 微整型,只佔用1個位元組,只能儲存0-255的整數。 SMALLINT– 小整型,佔用2個位元組,儲存範圍–327

Opencv各種編碼下視訊檔案大小對比

轉載自http://blog.csdn.net/dcrmg/article/details/52215930 做視訊樣本切割,切片用ffv1編碼,比原資料大了幾十倍,看到了這篇文章,防止找不到記錄一下 開啟視訊檔案或攝像頭視訊需要使用Opencv中的VideoCapture類,儲存視訊或攝像頭視訊到本地磁

H264編碼4( x264原始碼簡單分析概述)

來自:https://blog.csdn.net/leixiaohua1020/article/details/45536607   ===================================================== H.264原始碼分析文章列表:

最簡單的基於FFMPEG的音訊編碼(PCM編碼為AAC

                本文介紹一個最簡單的基於FFMPEG的音訊編碼器。該編碼器實現了PCM音訊取樣資料編碼為AAC的壓縮編碼資料。編碼器程式碼十分簡單,但是每一行程式碼都很重要。通過看本編碼器的原始碼,可以瞭解FFMPEG音訊編碼的流程。本程式使用最新版的類庫(編譯時間為2014.5.6),開發平

資料載入、儲存檔案格式

訪問資料是使用各類工具所必需的第一步。我們將重點關注使用pandas進行資料輸入和輸出,儘管其他庫中有許多工具可幫助讀取和寫入各種格式的資料。 輸入和輸出通常有以下幾種型別:讀取文字檔案及硬碟上其他更高效的格式檔案、從資料庫載入資料、與網路資源進行互動(比如Web API)。 1.1文字

Mp3原理檔案格式解析

1.引言 文 件壓縮技術的日新月異使得MP3成為時下最燙手的音樂格式,優質的音樂隨著0與1的排列迅速散佈到世界各地,撼動人心。何謂MP3?MP3的全稱是 MPEG Audio Layer 3,它是一種高效的計算機音訊編碼方案,它以較大的壓縮比將音訊檔案轉換成較小的副檔名為.MP3的檔案,基本保持原檔案的音質

基於FFMPEG的音訊編碼

編碼模組 編碼模組是編碼存放在FIFO中的資料,然後udp輸出,具體的資料流向圖如下: 編碼模組資料流向圖 編碼前,為32位雙聲道48KHz的PCM資料,因為ffmpeg MP2編碼器所支援的PCM資料為16位,所以需要PCM重取樣。  

ArcGIS 切片快取緊湊檔案格式分析與使用

一、分析 在ArcGIS 10中出現了一種新的切片快取檔案格式:緊湊型儲存(Compact)。與之前的鬆散型儲存(Exploded)相比,它有遷移方便、建立更快、減少儲存空間等諸多優點,已經成為了建立切片快取的預設格式。對於本身ArcGIS的產品而言,訪問緊湊型儲存與訪問鬆

H264編碼5( x264原始碼簡單分析:x264_slice_write() 與H264 編碼簡介)

  x264原始碼簡單分析:x264_slice_write() 來自:https://blog.csdn.net/leixiaohua1020/article/details/45536607     H264 編碼簡介 https://blo

Linux ELF檔案格式分析---objcopy命令的使用

本文轉自:https://blog.csdn.net/xj178926426/article/details/73777611  Linux ELF檔案格式分析—objcopy命令的使用 最近在看《程式設計師的自我修養—連結、裝載與庫》一書,對書中提到的一個小問題,自己做了

mp4(H264容器)的詳細檔案格式分析

十六進位制碼流分析:ftyp Box00 00 00 1C:  size ,28,表示此BOX有28個位元組,表示長度的四個位元組也計算在內。以下同66 74 79 70:  type,表示BOX TYPE,此處為ftyp6D 70 34 32:  可能是相容的格式資訊,/////mp4200 00 00 0

hadoop 1.0.4 fsimage 檔案格式分析

2013-01-08 周海漢 2013.1.8 http://abloz.com/2013/01/08/hadoop-1-0-4-fsimage-file-format.html fsimage檔案存放在NameNode中,

趣探 Mach-O:檔案格式分析

本文所讀的原始碼,可以從這裡找到,這是 Mach-O 系列的第一篇 我們的程式想要跑起來,肯定它的可執行檔案格式要被作業系統所理解,比如 ELF 是 Linux下可執行檔案的格式,PE32/PE32+是windows的可執行檔案的格式,那麼對於OS X和iOS 來說 Mach-

入門級 PDF 檔案格式分析

一、概述:     結構化的文件格式PDF(Portable Document Format)是由美國排版與影象處理軟體公司Adobe於1993年首次提出的。Adobe Reader這款pdf閱讀器軟體相信大家並不陌生,人們熟知它的原因是因為它的應用相當普及,可能接觸過計

C#BMP檔案格式分析並讀取

原文地址:https://blog.csdn.net/guanchanghui/article/details/1172092 主要是方便自己用,複製了一下,建議大家看原文 簡介 BMP(Bitmap-File)圖形檔案是Windows採用的圖形檔案格式,在Windows環

UNIX/LINUX 平臺可執行檔案格式分析

    本文討論了 UNIX/LINUX 平臺下三種主要的可執行檔案格式:a.out(assembler and link editor output 彙編器和連結編輯器的輸出)、COFF(Common Object File Format 通用物件檔案格式)、ELF(Executable and Linki

wav檔案格式分析(程式碼 C++ )

下面就來分析一下wav波形檔案的格式。   我們先隨便找一個wav檔案,檢視其屬性,就能得到下面的結果。            上面主要注意檔案大小,聲音長度與位元率。   檔案佔用空間就不用關心了,如果有人想知道為什麼檔案佔用空間比檔案大小要大,我在這裡也解釋一下。這和

CRF++模型檔案格式分析

        CRF++一種用c++實現條件隨機場模型的開源工具,效能好,被廣泛用於在自然語言處理中。由於其實現複雜,很難理解,下面用文字方式來表述其模型檔案的結構,希望加深對其實現方式的理解。 下面是對其模型檔案的分析: 原始訓練語料:中共中央/總書記/、/國家/主席/

PE檔案格式分析

最近需要對檔案加殼,看到這篇文章挺好的轉載一下,原文地址http://blog.csdn.net/shitdbg/article/details/49734495 一、PE的基本概念     PE(Portable Execute)檔案是Windows下可