1. 程式人生 > >視音訊資料處理入門:AAC音訊碼流解析

視音訊資料處理入門:AAC音訊碼流解析

=====================================================

視音訊資料處理入門系列文章:

=====================================================


本文繼續上一篇文章的內容,介紹一個音訊碼流處理程式。音訊碼流在視訊播放器中的位置如下所示。


本文中的程式是一個AAC碼流解析程式。該程式可以從AAC碼流中分析得到它的基本單元ADTS frame,並且可以簡單解析ADTS frame首部的欄位。通過修改該程式可以實現不同的AAC碼流處理功能。

原理

AAC原始碼流(又稱為“裸流”)是由一個一個的ADTS frame組成的。他們的結構如下圖所示。


其中每個ADTS frame之間通過syncword(同步字)進行分隔。同步字為0xFFF(二進位制“111111111111”)。AAC碼流解析的步驟就是首先從碼流中搜索0x0FFF,分離出ADTS frame;然後再分析ADTS frame的首部各個欄位。本文的程式即實現了上述的兩個步驟。

程式碼

整個程式位於simplest_aac_parser()函式中,如下所示。
/**
 * 最簡單的視音訊資料處理示例
 * Simplest MediaData Test
 *
 * 雷霄驊 Lei Xiaohua
 * [email protected]
 * 中國傳媒大學/數字電視技術
 * Communication University of China / Digital TV Technology
 * http://blog.csdn.net/leixiaohua1020
 *
 * 本專案包含如下幾種視音訊測試示例:
 *  (1)畫素資料處理程式。包含RGB和YUV畫素格式處理的函式。
 *  (2)音訊取樣資料處理程式。包含PCM音訊取樣格式處理的函式。
 *  (3)H.264碼流分析程式。可以分離並解析NALU。
 *  (4)AAC碼流分析程式。可以分離並解析ADTS幀。
 *  (5)FLV封裝格式分析程式。可以將FLV中的MP3音訊碼流分離出來。
 *  (6)UDP-RTP協議分析程式。可以將分析UDP/RTP/MPEG-TS資料包。
 *
 * This project contains following samples to handling multimedia data:
 *  (1) Video pixel data handling program. It contains several examples to handle RGB and YUV data.
 *  (2) Audio sample data handling program. It contains several examples to handle PCM data.
 *  (3) H.264 stream analysis program. It can parse H.264 bitstream and analysis NALU of stream.
 *  (4) AAC stream analysis program. It can parse AAC bitstream and analysis ADTS frame of stream.
 *  (5) FLV format analysis program. It can analysis FLV file and extract MP3 audio stream.
 *  (6) UDP-RTP protocol analysis program. It can analysis UDP/RTP/MPEG-TS Packet.
 *
 */
#include <stdio.h>
#include <stdlib.h>
#include <string.h>


int getADTSframe(unsigned char* buffer, int buf_size, unsigned char* data ,int* data_size){
	int size = 0;

	if(!buffer || !data || !data_size ){
		return -1;
	}

	while(1){
		if(buf_size  < 7 ){
			return -1;
		}
		//Sync words
		if((buffer[0] == 0xff) && ((buffer[1] & 0xf0) == 0xf0) ){
			size |= ((buffer[3] & 0x03) <<11);     //high 2 bit
			size |= buffer[4]<<3;                //middle 8 bit
			size |= ((buffer[5] & 0xe0)>>5);        //low 3bit
			break;
		}
		--buf_size;
		++buffer;
	}

	if(buf_size < size){
		return 1;
	}

	memcpy(data, buffer, size);
	*data_size = size;

	return 0;
}

int simplest_aac_parser(char *url)
{
	int data_size = 0;
	int size = 0;
	int cnt=0;
	int offset=0;

	//FILE *myout=fopen("output_log.txt","wb+");
	FILE *myout=stdout;

	unsigned char *aacframe=(unsigned char *)malloc(1024*5);
	unsigned char *aacbuffer=(unsigned char *)malloc(1024*1024);

	FILE *ifile = fopen(url, "rb");
	if(!ifile){
		printf("Open file error");
		return -1;
	}

	printf("-----+- ADTS Frame Table -+------+\n");
	printf(" NUM | Profile | Frequency| Size |\n");
	printf("-----+---------+----------+------+\n");

	while(!feof(ifile)){
		data_size = fread(aacbuffer+offset, 1, 1024*1024-offset, ifile);
		unsigned char* input_data = aacbuffer;

		while(1)
		{
			int ret=getADTSframe(input_data, data_size, aacframe, &size);
			if(ret==-1){
				break;
			}else if(ret==1){
				memcpy(aacbuffer,input_data,data_size);
				offset=data_size;
				break;
			}

			char profile_str[10]={0};
			char frequence_str[10]={0};

			unsigned char profile=aacframe[2]&0xC0;
			profile=profile>>6;
			switch(profile){
			case 0: sprintf(profile_str,"Main");break;
			case 1: sprintf(profile_str,"LC");break;
			case 2: sprintf(profile_str,"SSR");break;
			default:sprintf(profile_str,"unknown");break;
			}

			unsigned char sampling_frequency_index=aacframe[2]&0x3C;
			sampling_frequency_index=sampling_frequency_index>>2;
			switch(sampling_frequency_index){
			case 0: sprintf(frequence_str,"96000Hz");break;
			case 1: sprintf(frequence_str,"88200Hz");break;
			case 2: sprintf(frequence_str,"64000Hz");break;
			case 3: sprintf(frequence_str,"48000Hz");break;
			case 4: sprintf(frequence_str,"44100Hz");break;
			case 5: sprintf(frequence_str,"32000Hz");break;
			case 6: sprintf(frequence_str,"24000Hz");break;
			case 7: sprintf(frequence_str,"22050Hz");break;
			case 8: sprintf(frequence_str,"16000Hz");break;
			case 9: sprintf(frequence_str,"12000Hz");break;
			case 10: sprintf(frequence_str,"11025Hz");break;
			case 11: sprintf(frequence_str,"8000Hz");break;
			default:sprintf(frequence_str,"unknown");break;
			}


			fprintf(myout,"%5d| %8s|  %8s| %5d|\n",cnt,profile_str ,frequence_str,size);
			data_size -= size;
			input_data += size;
			cnt++;
		}   

	}
	fclose(ifile);
	free(aacbuffer);
	free(aacframe);

	return 0;
}

上文中的函式呼叫方法如下所示。
simplest_aac_parser("nocturne.aac");

結果

本程式的輸入為一個AAC原始碼流(裸流)的檔案路徑,輸出為該碼流中ADTS frame的統計資料,如下圖所示。


下載

Simplest mediadata test


專案主頁
開源中國:http://git.oschina.net/leixiaohua1020/simplest_mediadata_test


CSDN下載地址:http://download.csdn.net/detail/leixiaohua1020/9422409


本專案包含如下幾種視音訊資料解析示例:
 (1)畫素資料處理程式。包含RGB和YUV畫素格式處理的函式。
 (2)音訊取樣資料處理程式。包含PCM音訊取樣格式處理的函式。
 (3)H.264碼流分析程式。可以分離並解析NALU。
 (4)AAC碼流分析程式。可以分離並解析ADTS幀。
 (5)FLV封裝格式分析程式。可以將FLV中的MP3音訊碼流分離出來。
 (6)UDP-RTP協議分析程式。可以將分析UDP/RTP/MPEG-TS資料包。



雷霄驊 (Lei Xiaohua)
[email protected]

http://blog.csdn.net/leixiaohua1020


相關推薦

音訊資料處理入門AAC音訊解析

=====================================================視音訊資料處理入門系列文章:=====================================================本文繼續上一篇文章的內容,介紹一個音

音訊資料處理入門PCM音訊取樣資料處理

                =====================================================視音訊資料處理入門系列文章:=====================================================上一篇文章記錄了RGB/YUV視訊畫素

音訊資料處理入門UDP-RTP協議解析

=====================================================視音訊資料處理入門系列文章:=====================================================本文介紹網路協議資料的處理程式。網路

音訊資料處理入門FLV封裝格式解析

=====================================================視音訊資料處理入門系列文章:=====================================================前兩篇文章介紹了音訊碼流處理程式和視

音訊資料處理入門 AAC音訊解析

                =====================================================視音訊資料處理入門系列文章:=====================================================本文繼續上一篇文章的內容,介紹一個音訊

音訊資料處理入門 FLV封裝格式解析

                =====================================================視音訊資料處理入門系列文章:=====================================================前兩篇文章介紹了音訊碼流處理程式和視訊

音頻數據處理入門FLV封裝格式解析

tail rip 主頁 typedef gda ack print 地址 視頻 ===================================================== 視音頻數據處理入門系列文章: 視音頻數據處理入門:RGB、YUV像素數據處理 視音頻數

吳裕雄 資料探勘與分析案例實戰(4)——python資料處理工具Pandas

# 匯入模組import pandas as pdimport numpy as np # 構造序列gdp1 = pd.Series([2.8,3.01,8.99,8.59,5.18])print(gdp1)# 取出gdp1中的第一、第四和第五個元素print('行號風格的序列:\n',gdp1[[0,3,

Python004-資料處理示例以某個資料(欄位)為基準從資料中獲取不同的欄位行數

資料來源樣式如下所示:   需求: 讀取文字,以第一列為基準參考系,每個基準僅輸出滿足需要條數的資料;不滿足,全部輸出。 比如,基準為 6236683970000018780,輸出條數要求為 5。若文字中含有  6236683970000018780 多於

Linux ALSA音訊框架分析二linux音訊子系統介紹

   Phonon是KDE 4的多媒體API 。Phonon提供一個穩定的API允許KDE 4獨立於任何一個聲音系統伺服器如xine。Phonon讓各種後端提供介面給開發者所謂的"引擎";每個引擎運作在一個具體的後端。每個後端都可讓Phonon控制基本功能,如播放、暫停和搜尋。Phonon也支援更高層次的功能

資料處理不等式Data Processing Inequality

  我是在差分隱私下看到的,新解決方案的可用性肯定小於原有解決方案的可用性,也就是說資訊的後續處理只會降低所擁有的資訊量。   那麼如果這麼說的話為什麼還要做特徵工程呢,這是因為該不等式有一個巨大的前提就是資料處理方法無比的強大,比如很多的樣本要分類,我們做特徵提取後,SVM效果很好 ,但是如果用DNN之類

iOS音訊學習筆記一常見音訊封裝格式及編碼格式

(1) pcm格式    pcm是經過話筒錄音後直接得到的未經壓縮的資料流    資料大小=取樣頻率*取樣位數*聲道*秒數/8     取樣頻率一般是22k或者44k,位數一般是8位或者16位,聲道一般是單聲道或者雙聲道     pcm屬於編碼格式,就是一串由多個樣本值組成的資料流, 本身沒有任何頭資

大規模資料處理利器BloomFilter

#include <stdio.h>#include <stdlib.h>#include <string.h>unsigned int jshash(const char *s, unsigned size);unsigned int sdbmhash(const ch

Python空間資料處理2 GDAL柵格影象格式轉換

在《GDAL讀寫遙感影象》中,有提到了GDAL支援多種資料格式,那麼,如何對這些格式進行相互轉換呢? 這其實非常簡單,僅在寫影象時稍加修改即可。例如,當我需要將某種柵格影象轉換為img格式時,只需將《GDAL讀寫遙感影象》中的程式碼進行以下修改: 第42行

分散式資料處理框架Apache Beam

1簡介 大資料時代中,資料從簡單的批處理,擴充套件到實時處理、流處理。起初的MapReduce處理模式早已獨木難支。此外,大資料處理技術也是百花齊放,如 HBase、Hive、Kafka、Spark、Flink 等,對開發者而言,想要將其全部熟練運用幾乎是一項不可能完成的任

Python空間資料處理1 GDAL讀寫遙感影象

GDAL是空間資料處理的開源包,支援多種資料格式的讀寫。遙感影象是一種帶大地座標的柵格資料,遙感影象的柵格模型包含以下兩部分的內容: 柵格矩陣:由正方形或者矩形柵格點組成,每個柵格點所對應的數值為該點的像元值,在遙感影象中用於表示地物屬性值;遙感影象有單波段與多波段,波段表

Spark(一)—— 大資料處理入門

一、Spark介紹 Apache Spark is a fast and general-purpose cluster computing system. It provides high-level APIs in Java, Scala, Python and R, and an optimized

IOS資料處理及版本特性-NSKeyedArchiver儲存和解析

建立一個繼承自物件的類可被序列化和反序列化,這樣的話就可以歸檔到磁碟中火網路中 import Foundation class UserModel: NSObject , NSCoding {     var name:NSString!     va

資料處理系統都有哪些?(式計算系統)

我們在上一篇文章中給大家介紹了批處理系統以及迭代計算系統。這兩種方法都是比較抽象的,我們在這篇文章中給大家介紹一種Facebook經常使用的流式計算系統,希望這篇文章能夠給大家帶來幫助。 流式計算系統就是因為流式計算具有很強的實時性,需要對應用源源不斷產生的資料實時進行處理,使資料不積壓、不丟失,常用於

C語言入門將ASCII轉化為字元

#include “stdio.h” void main () { char c1; c1= 對應字元ASCII碼的十進位制的值,比如!就要在這裡輸33,左右不需要加括號引號; printf("%c ",c1); } 32以前的無法輸出是正常的 ASCII表