基於iOS的網路音視訊實時傳輸系統（三）- VideoToolbox編碼音視訊資料為H264、AAC

阿新 • • 發佈：2019-02-17

server端 -- 編碼音視訊資料為H264、AAC

這部分花了好多時間，本身就不具備這方面的相關知識，查閱了不少資料，不過關於VideoToolbox和AudioToolbox方面的編碼資料寥寥無幾，雖然網上搜索結果看似特別多，其實一看內容也大同小異，建議還是看看官方的文件。

下載

VideoToolbox編碼視訊資料為H264

初始化--建立session

        // ----- 1. 建立session -----
        int width = 640, height = 480;
        OSStatus status = VTCompressionSessionCreate(NULL, width, height,
                                                     kCMVideoCodecType_H264, NULL, NULL, NULL,
                                                     didCompressH264, (__bridge void *)(self),  &EncodingSession);
        NSLog(@"H264: VTCompressionSessionCreate %d", (int)status);
        if (status != 0)
        {
            NSLog(@"H264: session 建立失敗");
            return ;
        }
        
        // ----- 2. 設定session屬性 -----
        // 設定實時編碼輸出（避免延遲）
        VTSessionSetProperty(EncodingSession, kVTCompressionPropertyKey_RealTime, kCFBooleanTrue);
        VTSessionSetProperty(EncodingSession, kVTCompressionPropertyKey_ProfileLevel, kVTProfileLevel_H264_Baseline_AutoLevel);
        
        // 設定關鍵幀（GOPsize)間隔
        int frameInterval = 10;
        CFNumberRef  frameIntervalRef = CFNumberCreate(kCFAllocatorDefault, kCFNumberIntType, &frameInterval);
        VTSessionSetProperty(EncodingSession, kVTCompressionPropertyKey_MaxKeyFrameInterval, frameIntervalRef);
        
        // 設定期望幀率
        int fps = 10;
        CFNumberRef  fpsRef = CFNumberCreate(kCFAllocatorDefault, kCFNumberIntType, &fps);
        VTSessionSetProperty(EncodingSession, kVTCompressionPropertyKey_ExpectedFrameRate, fpsRef);
        
        
        //設定位元速率，上限，單位是bps
        int bitRate = width * height * 3 * 4 * 8;
        CFNumberRef bitRateRef = CFNumberCreate(kCFAllocatorDefault, kCFNumberSInt32Type, &bitRate);
        VTSessionSetProperty(EncodingSession, kVTCompressionPropertyKey_AverageBitRate, bitRateRef);
        
        //設定位元速率，均值，單位是byte
        int bitRateLimit = width * height * 3 * 4;
        CFNumberRef bitRateLimitRef = CFNumberCreate(kCFAllocatorDefault, kCFNumberSInt32Type, &bitRateLimit);
        VTSessionSetProperty(EncodingSession, kVTCompressionPropertyKey_DataRateLimits, bitRateLimitRef);
        
        // Tell the encoder to start encoding
        VTCompressionSessionPrepareToEncodeFrames(EncodingSession);

編碼完成回撥

將來通過這個回撥獲取H264資料

void didCompressH264(void *outputCallbackRefCon,
                     void *sourceFrameRefCon,
                     OSStatus status,
                     VTEncodeInfoFlags infoFlags,
                     CMSampleBufferRef sampleBuffer)
{
//    NSLog(@"didCompressH264 called with status %d infoFlags %d", (int)status, (int)infoFlags); // 0 1
    if (status != 0) {
        return;
    }
    
    if (!CMSampleBufferDataIsReady(sampleBuffer)) {
        NSLog(@"didCompressH264 data is not ready ");
        return;
    }
//    ViewController* encoder = (__bridge ViewController*)outputCallbackRefCon;
    
    HJH264Encoder *encoder = (__bridge HJH264Encoder*)(outputCallbackRefCon);
    
    // ----- 關鍵幀獲取SPS和PPS ------
    bool keyframe = !CFDictionaryContainsKey( (CFArrayGetValueAtIndex(CMSampleBufferGetSampleAttachmentsArray(sampleBuffer, true), 0)), kCMSampleAttachmentKey_NotSync);
    // 判斷當前幀是否為關鍵幀
    // 獲取sps & pps資料
    if (keyframe)
    {
        CMFormatDescriptionRef format = CMSampleBufferGetFormatDescription(sampleBuffer);
        size_t sparameterSetSize, sparameterSetCount;
        const uint8_t *sparameterSet;
        OSStatus statusCode = CMVideoFormatDescriptionGetH264ParameterSetAtIndex(format, 0, &sparameterSet, &sparameterSetSize, &sparameterSetCount, 0 );
        if (statusCode == noErr)
        {
            // Found sps and now check for pps
            size_t pparameterSetSize, pparameterSetCount;
            const uint8_t *pparameterSet;
            OSStatus statusCode = CMVideoFormatDescriptionGetH264ParameterSetAtIndex(format, 1, &pparameterSet, &pparameterSetSize, &pparameterSetCount, 0 );
            if (statusCode == noErr)
            {
                // Found pps
                NSData *sps = [NSData dataWithBytes:sparameterSet length:sparameterSetSize];
                NSData *pps = [NSData dataWithBytes:pparameterSet length:pparameterSetSize];
                if (encoder)
                {
                    [encoder gotSpsPps:sps pps:pps];  // 獲取sps & pps資料
                }
            }
        }
    }
    
    
    // --------- 寫入資料 ----------
    CMBlockBufferRef dataBuffer = CMSampleBufferGetDataBuffer(sampleBuffer);
    size_t length, totalLength;
    char *dataPointer;
    OSStatus statusCodeRet = CMBlockBufferGetDataPointer(dataBuffer, 0, &length, &totalLength, &dataPointer);
    if (statusCodeRet == noErr) {
        size_t bufferOffset = 0;
        static const int AVCCHeaderLength = 4; // 返回的nalu資料前四個位元組不是0001的startcode，而是大端模式的幀長度length
        
        // 迴圈獲取nalu資料
        while (bufferOffset < totalLength - AVCCHeaderLength) {
            uint32_t NALUnitLength = 0;
            // Read the NAL unit length
            memcpy(&NALUnitLength, dataPointer + bufferOffset, AVCCHeaderLength);
            
            // 從大端轉系統端
            NALUnitLength = CFSwapInt32BigToHost(NALUnitLength);
            
            NSData* data = [[NSData alloc] initWithBytes:(dataPointer + bufferOffset + AVCCHeaderLength) length:NALUnitLength];
            [encoder gotEncodedData:data isKeyFrame:keyframe];
            
            // Move to the next NAL unit in the block buffer
            bufferOffset += AVCCHeaderLength + NALUnitLength;
        }
    }
}

傳入需要編碼的幀

- (void) encode:(CMSampleBufferRef )sampleBuffer
{
    CVImageBufferRef imageBuffer = (CVImageBufferRef)CMSampleBufferGetImageBuffer(sampleBuffer);
    // 幀時間，如果不設定會導致時間軸過長。
    CMTime presentationTimeStamp = CMTimeMake(frameID++, 1000); // CMTimeMake(分子，分母)；分子/分母 = 時間(秒)
    VTEncodeInfoFlags flags;
    OSStatus statusCode = VTCompressionSessionEncodeFrame(EncodingSession,
                                                          imageBuffer,
                                                          presentationTimeStamp,
                                                          kCMTimeInvalid,
                                                          NULL, NULL, &flags);
    if (statusCode != noErr) {
        NSLog(@"H264: VTCompressionSessionEncodeFrame failed with %d", (int)statusCode);
        
        VTCompressionSessionInvalidate(EncodingSession);
        CFRelease(EncodingSession);
        EncodingSession = NULL;
        return;
    }
}

然後就可以在上面的回撥裡取得編碼後的資料，再把資料通過socket發給客戶端即可。

在每個階段都要記得測試、列印日誌，不然以後找bug會很辛苦的。

這裡可以把編碼後的資料寫入本地檔案，然後用VLC工具開啟，檢測編碼是否有問題。

最後不要忘記關閉編碼器

- (void)EndVideoToolBox
{
    VTCompressionSessionCompleteFrames(EncodingSession, kCMTimeInvalid);
    VTCompressionSessionInvalidate(EncodingSession);
    CFRelease(EncodingSession);
    EncodingSession = NULL;
}

另：在macOS環境下使用VideoToolbox編碼的過程在這個部落格裡：

AudioToolbox編碼音訊資料為AAC

設定編碼引數

- (void) setupEncoderFromSampleBuffer:(CMSampleBufferRef)sampleBuffer {
    AudioStreamBasicDescription inAudioStreamBasicDescription = *CMAudioFormatDescriptionGetStreamBasicDescription((CMAudioFormatDescriptionRef)CMSampleBufferGetFormatDescription(sampleBuffer));
    
    AudioStreamBasicDescription outAudioStreamBasicDescription = {0}; // 初始化輸出流的結構體描述為0. 很重要。
    outAudioStreamBasicDescription.mSampleRate = inAudioStreamBasicDescription.mSampleRate; // 音訊流，在正常播放情況下的幀率。如果是壓縮的格式，這個屬性表示解壓縮後的幀率。幀率不能為0。
    outAudioStreamBasicDescription.mFormatID = kAudioFormatMPEG4AAC; // 設定編碼格式
    outAudioStreamBasicDescription.mFormatFlags = kMPEG4Object_AAC_LC; // 無損編碼 ，0表示沒有
    outAudioStreamBasicDescription.mBytesPerPacket = 0; // 每一個packet的音訊資料大小。如果的動態大小，設定為0。動態大小的格式，需要用AudioStreamPacketDescription 來確定每個packet的大小。
    outAudioStreamBasicDescription.mFramesPerPacket = 1024; // 每個packet的幀數。如果是未壓縮的音訊資料，值是1。動態位元速率格式，這個值是一個較大的固定數字，比如說AAC的1024。如果是動態大小幀數（比如Ogg格式）設定為0。
    outAudioStreamBasicDescription.mBytesPerFrame = 0; //  每幀的大小。每一幀的起始點到下一幀的起始點。如果是壓縮格式，設定為0 。
    outAudioStreamBasicDescription.mChannelsPerFrame = 1; // 聲道數
    outAudioStreamBasicDescription.mBitsPerChannel = 0; // 壓縮格式設定為0
    outAudioStreamBasicDescription.mReserved = 0; // 8位元組對齊，填0.
    AudioClassDescription *description = [self
                                          getAudioClassDescriptionWithType:kAudioFormatMPEG4AAC
                                          fromManufacturer:kAppleSoftwareAudioCodecManufacturer]; //軟編
    
    OSStatus status = AudioConverterNewSpecific(&inAudioStreamBasicDescription, &outAudioStreamBasicDescription, 1, description, &_audioConverter); // 建立轉換器
    if (status != 0) {
        NSLog(@"setup converter: %d", (int)status);
    }
}

獲取編解碼器

- (AudioClassDescription *)getAudioClassDescriptionWithType:(UInt32)type
                                           fromManufacturer:(UInt32)manufacturer
{
    static AudioClassDescription desc;
    
    UInt32 encoderSpecifier = type;
    OSStatus st;
    
    UInt32 size;
    st = AudioFormatGetPropertyInfo(kAudioFormatProperty_Encoders,
                                    sizeof(encoderSpecifier),
                                    &encoderSpecifier,
                                    &size);
    if (st) {
        NSLog(@"error getting audio format propery info: %d", (int)(st));
        return nil;
    }
    
    unsigned int count = size / sizeof(AudioClassDescription);
    AudioClassDescription descriptions[count];
    st = AudioFormatGetProperty(kAudioFormatProperty_Encoders,
                                sizeof(encoderSpecifier),
                                &encoderSpecifier,
                                &size,
                                descriptions);
    if (st) {
        NSLog(@"error getting audio format propery: %d", (int)(st));
        return nil;
    }
    
    for (unsigned int i = 0; i < count; i++) {
        if ((type == descriptions[i].mSubType) &&
            (manufacturer == descriptions[i].mManufacturer)) {
            memcpy(&desc, &(descriptions[i]), sizeof(desc));
            return &desc;
        }
    }
    
    return nil;
}

將裝置捕獲到的音訊資料傳給編碼器

- (void) encodeSampleBuffer:(CMSampleBufferRef)sampleBuffer completionBlock:(void (^)(NSData * encodedData, NSError* error))completionBlock {
    CFRetain(sampleBuffer);
    dispatch_async(_encoderQueue, ^{
        if (!_audioConverter) {
            [self setupEncoderFromSampleBuffer:sampleBuffer];
        }
        CMBlockBufferRef blockBuffer = CMSampleBufferGetDataBuffer(sampleBuffer);
        CFRetain(blockBuffer);
        // --------- 通過CMBlockBufferGetDataPointer獲取到_pcmBufferSize和_pcmBuffer --------
        OSStatus status = CMBlockBufferGetDataPointer(blockBuffer, 0, NULL, &_pcmBufferSize, &_pcmBuffer);
        NSError *error = nil;
        if (status != kCMBlockBufferNoErr) {
            error = [NSError errorWithDomain:NSOSStatusErrorDomain code:status userInfo:nil];
        }
        memset(_aacBuffer, 0, _aacBufferSize);
        
        AudioBufferList outAudioBufferList = {0};
        outAudioBufferList.mNumberBuffers = 1;
        outAudioBufferList.mBuffers[0].mNumberChannels = 1;
        outAudioBufferList.mBuffers[0].mDataByteSize = (int)_aacBufferSize;
        outAudioBufferList.mBuffers[0].mData = _aacBuffer;
        AudioStreamPacketDescription *outPacketDescription = NULL;
        UInt32 ioOutputDataPacketSize = 1;
        // Converts data supplied by an input callback function, supporting non-interleaved and packetized formats.
        // Produces a buffer list of output data from an AudioConverter. The supplied input callback function is called whenever necessary.
        status = AudioConverterFillComplexBuffer(_audioConverter, inInputDataProc, (__bridge void *)(self), &ioOutputDataPacketSize, &outAudioBufferList, outPacketDescription);
        NSData *data = nil;
        if (status == 0) {
            NSData *rawAAC = [NSData dataWithBytes:outAudioBufferList.mBuffers[0].mData length:outAudioBufferList.mBuffers[0].mDataByteSize];
            NSData *adtsHeader = [self adtsDataForPacketLength:rawAAC.length];
            NSMutableData *fullData = [NSMutableData dataWithData:adtsHeader];
            [fullData appendData:rawAAC];
            data = fullData;
        } else {
            error = [NSError errorWithDomain:NSOSStatusErrorDomain code:status userInfo:nil];
        }
        
        if (completionBlock) {
            dispatch_async(_callbackQueue, ^{
//                printf("----- audio data len = %d ----\n",(int)[data length]);
                completionBlock(data, error);
            });
        }
        CFRelease(sampleBuffer);
        CFRelease(blockBuffer);
    });
}

回撥函式

OSStatus inInputDataProc(AudioConverterRef inAudioConverter, UInt32 *ioNumberDataPackets, AudioBufferList *ioData, AudioStreamPacketDescription **outDataPacketDescription, void *inUserData)
{
    AACEncoder *encoder = (__bridge AACEncoder *)(inUserData);
    UInt32 requestedPackets = *ioNumberDataPackets;
    
    size_t copiedSamples = [encoder copyPCMSamplesIntoBuffer:ioData];
    if (copiedSamples < requestedPackets) {
        //PCM 緩衝區還沒滿
        *ioNumberDataPackets = 0;
        return -1;
    }
    *ioNumberDataPackets = 1;
    
    return noErr;
}

/**
 *  填充PCM到緩衝區
 */
- (size_t) copyPCMSamplesIntoBuffer:(AudioBufferList*)ioData {
    size_t originalBufferSize = _pcmBufferSize;
    if (!originalBufferSize) {
        return 0;
    }
    ioData->mBuffers[0].mData = _pcmBuffer;
    ioData->mBuffers[0].mDataByteSize = (int)_pcmBufferSize;
    _pcmBuffer = NULL;
    _pcmBufferSize = 0;
    return originalBufferSize;
}

最後在需要的地方釋放編碼器

- (void) dealloc {
    AudioConverterDispose(_audioConverter);
    free(_aacBuffer);
}

參考文章

基於iOS的網路音視訊實時傳輸系統（三）- VideoToolbox編碼音視訊資料為H264、AAC

server端 -- 編碼音視訊資料為H264、AAC 這部分花了好多時間，本身就不具備這方面的相關知識，查閱了不少資料，不過關於VideoToolbox和AudioToolbox方面的編碼資料寥寥無幾，雖然網上搜索結果看似特別多，其實一看內容也大同小異，建議還是看看官方

基於BP神經網路的數字識別基礎系統（三）

基於BP神經網路的數字識別基礎系統（三）（接上篇）上一篇的連結：http://blog.csdn.net/z_x_1996/article/details/60779141 上篇博文中筆者簡單的介紹了一下梯度下降演算法，這裡接著為大家介紹增量梯度下降演算法。 2.2.

基於 HTML5 WebGL 的樓宇智慧化整合系統（三）

前言 2018年7月，資訊化部印發了《工業網際網路平臺建設及推廣指南》和《工業網際網路平臺評價方法》，掀起了工業網際網路的浪潮，併成為熱詞寫入了報告中。同為資訊發展下的產物建築智慧化整合系統也是兼具著資訊與管

基於BP神經網路的數字識別基礎系統（四）

基於BP神經網路的數字識別基礎系統（四）（接上篇）上一篇的連結：http://blog.csdn.net/z_x_1996/article/details/68490009 3.系統設計上一篇筆者已經討論完了BP神經網路需要用到的知識點，接下來就開始設計符合我們標題

網路安全傳輸系統（7）-總結

突然發現這個專案還沒有總結，現在補加一下 1、實現功能 1、使用者可以建立或者登陸一個賬號 2、使用者可以通過網路上傳或者下載自己的檔案 3、通過SSL加密資料在網路中的傳輸 4、使用執行緒池技術來優化這個系統 2、使用技術 1、socket程式設計 2、檔案程式設計

音視訊開發——流媒體資料傳輸RTP（三）

iOS音視訊開發相關文章：實時傳送協議（Real-time Transport Protocol或簡寫RTP，也可以寫成RTTP）是一個網路傳輸協議。 RTP協議是通過UDP層傳輸的，在本例中仍然使用CocoaAsyncSocket庫實現UDP協議。 1、註冊

Java實驗--基於Swing的簡單的歌曲信息管理系統（三）

img dbo check clas str http 按鈕 cancel uuid 轉載請註明出處，上一篇《Java實驗--基於Swing的簡單的歌曲信息管理系統（二）》介紹了項目的目錄結構和Dao層，本篇主要講解界面的繪制和業務層Service。登錄界面　　登錄

計算機網路——傳輸層（三）

TCP協議傳送端應用程式通過套接字介面將資料傳向傳輸層之後，這些資料就歸傳輸層管了，這裡就是TCP協議。TCP協議會管理一個傳送快取，所有通過套接字介面的資料會被放到這個傳送快取中去，然後TCP每次從這個快取中拿出資料，將資料傳遞到網路層。其實這個過程就是多路複用。我們可以這麼理

基於神經網路的驗證碼實驗研究（一）

前言本次實驗研究完整程式碼 ->進入 From Github 一.CAPTCHA 提到驗證碼，生活中各種各樣的平臺都會在使用者常規操作管理下實行驗證碼機制。對於我淺顯的理解，一是區分人與機器的認證互動，在有行為發生的情況下，我們要判斷是否是使用者主觀操作，本意所為，因

基於Java Web的網上圖書商城管理系統——（三）

三、詳細設計 1.註冊 regist.jsp頁面------>UserServlet----->UserDao &

基於Python檢索系統（3）分詞後建立資料結構

分詞應用的是Jieba分詞工具，將爬取得到的新聞進行中文分詞，也就是為了得到以後檢索要用到的關鍵詞。我們給每個關鍵詞建立一個單獨的索引，引入間接桶，應用倒排索引的方法實現最終的結果。

基於ssm框架的個人部落格系統（10）--編寫部落格頁面開發

在前面我們實現了部落格管理的分頁、查詢和刪除，現在我們來設計實現編寫部落格的頁面，要寫部落格，我們就使用富文字編輯器，有很多可以選擇KingEditor、UEditor、CkEditor，我沒用過百度的UEditor，現在試一回，反正是中文的，應該是容易上手的。自行下載：

基於arm板的專案——智慧家居系統（一）

一.前言上一篇部落格是13號寫的，今天是23號了，這麼久沒寫部落格是因為設計智慧家居系統去了。隨著計算機的發展，越來越多的領域涉及到計算機。可以這麼說現代社會已經離不開計算機了。最近總是聽說智

基於tensorflow的MNIST手寫數字識別（三）--神經網路篇

想想還是要說點什麼抱歉啊，第三篇姍姍來遲，確實是因為我懶，而不是忙什麼的，所以這次再加點料，以表示我的歉意。廢話不多說，我就直接開始講了。加入神經網路的意義前面也講到了，使用普通的訓練方法，也可以進行識別，但是識別的精度不夠高，

基於 HTML5 WebGL 的樓宇智慧化整合系統（二）

前言一套完整的視覺化操作互動上，必不可少 2D/3D 的融合，在上期我們介紹了有關 3D 場景的環視漫遊、巡視漫遊以及動畫效果，還包括了冷站場景、熱站場景以及智慧末端的實現原理，本期主要介紹關於 2D 圖紙面板的動畫效果以及面板視訊的嵌入。通過

基於 HTML5 WebGL 的樓宇智慧化整合系統（一）

前言隨著現代通訊技術、計算機技術、控制技術的飛速發展，智慧建築已經成為現代建築發展的主流。智慧建築是以建築物為平臺，兼備資訊設施系統、資訊化應用系統、建築裝置管理系統、公共安全系統等。集結構、系統、服務、管理及其優化組合為一體，向人們提供一個安全、高效、便攜、節能、

基於centos6的mysql5.7.13主從部署（三）

linux mysql主從部署基於centos6的mysql5.7.13主從部署（三）主從測試登入（主）mysql1[[email protected]/* */ ~]# mysql -uroot -p123456mysql> unlock tables; #解鎖，對應上一章節的表的

自己搭建自動化巡檢系統（三）通過telnet實現遠程創建loopback

telnet loopback 我們在上一章完成了用代碼操作telnet，實現了遠程控制，分析前面的代碼會發現健壯性太低，需要進行優化，後續會通過開發一個交互式界面來完成人工介入操作網絡的過程。本次實驗目的：實現自動化創建環回口首先更新拓撲，拉出新的路由器和一臺交換機import telnetlibi

個性化推薦系統（三）---推薦系統意義一點思考

進展這樣的 es2017 意見推廣移動付出技術 com 個性化推薦是隨著移動互聯網發展不斷發展起來的，國內應用個性化推薦技術最早應該是豆瓣，在web2.0興起時做了很多嘗試，給網民帶來很多新鮮感覺、體驗。後來是國外電影租賃網站netflex推波助瀾

SCCM 2016 使用PXE 部署操作系統（三）

兼容性版本信息重新設定 locker proc roc wim 定義上篇文章我們講到了如何在SCCM 2016裏面分發啟動映像和操作系統映像。不同於WDS，分發完還需要配置一個叫做任務序列的東西。只有配置了它，SCCM才能發揮其強大的自定義功能！在“軟件庫”-“概

基於iOS的網路音視訊實時傳輸系統（三）- VideoToolbox編碼音視訊資料為H264、AAC

下載

VideoToolbox編碼視訊資料為H264

初始化--建立session

編碼完成回撥

傳入需要編碼的幀

AudioToolbox編碼音訊資料為AAC

設定編碼引數

獲取編解碼器

將裝置捕獲到的音訊資料傳給編碼器

回撥函式

參考文章

相關文章

相關推薦