最簡單的視音訊播放示例9:SDL2播放PCM
最簡單的視音訊播放示例系列文章列表:
=====================================================
本文記錄SDL播放音訊的技術。在這裡使用的版本是SDL2。實際上SDL本身並不提供視音訊播放的功能,它只是封裝了視音訊播放的底層API。在Windows平臺下,SDL封裝了Direct3D這類的API用於播放視訊;封裝了DirectSound這類的API用於播放音訊。因為SDL的編寫目的就是簡化視音訊播放的開發難度,所以使用SDL播放視訊(YUV/RGB)和音訊(PCM)資料非常的容易。
SDL簡介
SDL(Simple DirectMedia Layer)是一套開放原始碼的跨平臺多媒體開發庫,使用C語言寫成。SDL提供了數種控制影象、聲音、輸出入的函式,讓開發者只要用相同或是相似的程式碼就可以開發出跨多個平臺(Linux、Windows、Mac OS X等)的應用軟體。目前SDL多用於開發遊戲、模擬器、媒體播放器等多媒體應用領域。用下面這張圖可以很明確地說明SDL的用途。
SDL實際上並不限於視音訊的播放,它將功能分成下列數個子系統(subsystem):
Video(影象):影象控制以及執行緒(thread)和事件管理(event)。
Audio(聲音):聲音控制
Joystick(搖桿):遊戲搖桿控制
CD-ROM(光碟驅動器):光碟媒體控制
Window Management(視窗管理):與視窗程式設計整合
Event(事件驅動):處理事件驅動
在Windows下,SDL與DirectX的對應關係如下。
SDL |
DirectX |
SDL_Video、SDL_Image |
DirectDraw、Direct3D |
SDL_Audio、SDL_Mixer |
DirectSound |
SDL_Joystick、SDL_Base |
DirectInput |
SDL_Net |
DirectPlay |
注:上文內容在《使用SDL播放視訊》的文章中已經介紹,這裡再次重複貼一遍。
SDL播放音訊的流程
SDL播放音訊的流程狠簡單,分為以下步驟。
1.初始化2.迴圈播放資料1)初始化SDL。
2)根據引數(SDL_AudioSpec)開啟音訊裝置
1)播放音訊資料。
2)延時等待播放完成。
下面詳細分析一下上文流程。
1.初始化
1)初始化SDL。
使用SDL_Init()初始化SDL。該函式可以確定希望啟用的子系統。SDL_Init()函式原型如下:- int SDLCALL SDL_Init(Uint32 flags)
其中,flags可以取下列值:
SDL_INIT_TIMER:定時器
SDL_INIT_AUDIO:音訊
SDL_INIT_VIDEO:視訊
SDL_INIT_JOYSTICK:搖桿
SDL_INIT_HAPTIC:觸控式螢幕
SDL_INIT_GAMECONTROLLER:遊戲控制器
SDL_INIT_EVENTS:事件
SDL_INIT_NOPARACHUTE:不捕獲關鍵訊號(這個不理解)
SDL_INIT_EVERYTHING:包含上述所有選項
有關SDL_Init()有一點需要注意:初始化的時候儘量做到“夠用就好”,而不要用SDL_INIT_EVERYTHING。因為有些情況下使用SDL_INIT_EVERYTHING會出現一些不可預知的問題。例如,在MFC應用程式中播放純音訊,如果初始化SDL的時候使用SDL_INIT_EVERYTHING,那麼就會出現聽不到聲音的情況。後來發現,去掉了SDL_INIT_VIDEO之後,問題才得以解決。
2)根據引數(SDL_AudioSpec)開啟音訊裝置使用SDL_OpenAudio()開啟音訊裝置。該函式需要傳入一個SDL_AudioSpec的結構體。DL_OpenAudio()的原型如下。
- int SDLCALL SDL_OpenAudio(SDL_AudioSpec * desired,
- SDL_AudioSpec * obtained);
它的引數是兩個SDL_AudioSpec結構體,它們的含義:
desired:期望的引數。
obtained:實際音訊裝置的引數,一般情況下設定為NULL即可。
SDL_AudioSpec結構體的定義如下。
- typedefstruct SDL_AudioSpec
- {
- int freq; /**< DSP frequency -- samples per second */
- SDL_AudioFormat format; /**< Audio data format */
- Uint8 channels; /**< Number of channels: 1 mono, 2 stereo */
- Uint8 silence; /**< Audio buffer silence value (calculated) */
- Uint16 samples; /**< Audio buffer size in samples (power of 2) */
- Uint16 padding; /**< Necessary for some compile environments */
- Uint32 size; /**< Audio buffer size in bytes (calculated) */
- SDL_AudioCallback callback;
- void *userdata;
- } SDL_AudioSpec;
其中包含了關於音訊各種引數:
freq:音訊資料的取樣率。常用的有48000,44100等。
format:音訊資料的格式。舉例幾種格式:
AUDIO_U16SYS:Unsigned 16-bit samples
AUDIO_S16SYS:Signed 16-bit samples
AUDIO_S32SYS:32-bit integer samples
AUDIO_F32SYS:32-bit floating point samples
channels:聲道數。例如單聲道取值為1,立體聲取值為2。
silence:設定靜音的值。
samples:音訊緩衝區中的取樣個數,要求必須是2的n次方。
padding:考慮到相容性的一個引數。
size:音訊緩衝區的大小,以位元組為單位。
callback:填充音訊緩衝區的回撥函式。
userdata:使用者自定義的資料。
在這裡記錄一下填充音訊緩衝區的回撥函式的作用。當音訊裝置需要更多資料的時候會呼叫該回調函式。回撥函式的格式要求如下。
- void (SDLCALL * SDL_AudioCallback) (void *userdata, Uint8 * stream,
- int len);
回撥函式的引數含義如下所示。
userdata:SDL_AudioSpec結構中的使用者自定義資料,一般情況下可以不用。
stream:該指標指向需要填充的音訊緩衝區。
len:音訊緩衝區的大小(以位元組為單位)。
在回撥函式中可以使用SDL_MixAudio()完成混音等工作。眾所周知SDL2和SDL1.x關於視訊方面的API差別很大。但是SDL2和SDL1.x關於音訊方面的API是一模一樣的。唯獨在回撥函式中,SDL2有一個地方和SDL1.x不一樣:SDL2中必須首先使用SDL_memset()將stream中的資料設定為0。
2.迴圈播放資料
1)播放音訊資料。
使用SDL_PauseAudio()可以播放音訊資料。SDL_PauseAudio()的原型如下。
- void SDLCALL SDL_PauseAudio(int pause_on)
當pause_on設定為0的時候即可開始播放音訊資料。設定為1的時候,將會播放靜音的值。
2)延時等待播放完成。
這一步就是延時等待音訊播放完畢了。使用像SDL_Delay()這樣的延時函式即可。
程式碼
原始碼如下所示。- /**
- * 最簡單的SDL2播放音訊的例子(SDL2播放PCM)
- * Simplest Audio Play SDL2 (SDL2 play PCM)
- *
- * 雷霄驊 Lei Xiaohua
- * [email protected]
- * 中國傳媒大學/數字電視技術
- * Communication University of China / Digital TV Technology
- * http://blog.csdn.net/leixiaohua1020
- *
- * 本程式使用SDL2播放PCM音訊取樣資料。SDL實際上是對底層繪圖
- * API(Direct3D,OpenGL)的封裝,使用起來明顯簡單于直接呼叫底層
- * API。
- *
- * 函式呼叫步驟如下:
- *
- * [初始化]
- * SDL_Init(): 初始化SDL。
- * SDL_OpenAudio(): 根據引數(儲存於SDL_AudioSpec)開啟音訊裝置。
- * SDL_PauseAudio(): 播放音訊資料。
- *
- * [迴圈播放資料]
- * SDL_Delay(): 延時等待播放完成。
- *
- * This software plays PCM raw audio data using SDL2.
- * SDL is a wrapper of low-level API (DirectSound).
- * Use SDL is much easier than directly call these low-level API.
- *
- * The process is shown as follows:
- *
- * [Init]
- * SDL_Init(): Init SDL.
- * SDL_OpenAudio(): Opens the audio device with the desired
- * parameters (In SDL_AudioSpec).
- * SDL_PauseAudio(): Play Audio.
- *
- * [Loop to play data]
- * SDL_Delay(): Wait for completetion of playback.
- */
- #include <stdio.h>
- #include <tchar.h>
- extern"C"
- {
- #include "sdl/SDL.h"
- };
- //Buffer:
- //|-----------|-------------|
- //chunk-------pos---len-----|
- static Uint8 *audio_chunk;
- static Uint32 audio_len;
- static Uint8 *audio_pos;
- /* Audio Callback
- * The audio function callback takes the following parameters:
- * stream: A pointer to the audio buffer to be filled
- * len: The length (in bytes) of the audio buffer
- *
- */
- void fill_audio(void *udata,Uint8 *stream,int len){
- //SDL 2.0
- SDL_memset(stream, 0, len);
- if(audio_len==0)
- return;
- len=(len>audio_len?audio_len:len);
- SDL_MixAudio(stream,audio_pos,len,SDL_MIX_MAXVOLUME);
- audio_pos += len;
- audio_len -= len;
- }
- int main(int argc, char* argv[])
- {
- //Init
- if(SDL_Init(SDL_INIT_AUDIO | SDL_INIT_TIMER)) {
- printf( "Could not initialize SDL - %s\n", SDL_GetError());
- return -1;
- }
- //SDL_AudioSpec
- SDL_AudioSpec wanted_spec;
- wanted_spec.freq = 44100;
- wanted_spec.format = AUDIO_S16SYS;
- wanted_spec.channels = 2;
- wanted_spec.silence = 0;
- wanted_spec.samples = 1024;
- wanted_spec.callback = fill_audio;
- if (SDL_OpenAudio(&wanted_spec, NULL)<0){
- printf("can't open audio.\n");
- return -1;
- }
- FILE *fp=fopen("../NocturneNo2inEflat_44.1k_s16le.pcm","rb+");
- if(fp==NULL){
- printf("cannot open this file\n");
- return -1;
- }
- int pcm_buffer_size=4096;
- char *pcm_buffer=(char *)malloc(pcm_buffer_size);
- int data_count=0;