1. 程式人生 > >深挖“窄帶高清”的實現原理

深挖“窄帶高清”的實現原理

興趣 愛奇藝 系統 打分 商業 peak 第一篇 速度 分享

過去幾年,又拍雲一直在點播、直播等視頻應用方面潛心鉆研,取得了不俗的成果。我們結合點播、直播、短視頻等業務中的用戶場景,推出了“省帶寬、壓成本”系列文章,從編碼技術、網絡架構等角度出發,結合又拍雲的產品成果,向大家介紹節省流量,降低帶寬成本的妙招。

《降低30%視頻碼率,深挖“窄帶高清”的實現原理》是“省帶寬、壓成本”系列文章的第3篇。本文將深挖又拍雲最新技術窄帶高清,講解窄帶高清是怎樣在不改變視頻主觀質量的情況下,通過改變碼率來降低視頻播放的帶寬成本。

往期回顧:

第一篇:《節省50%以上的流量成本,從產品架構看PCDN的節流能力》

第二篇:《深入解析 H.265 編碼模式,帶你了解 Apple 全面推進 H.265 的原因》

第三篇:《愛奇藝第一季度又燒了11個億元,什麽時候是個頭?》

第四篇:《降低30%視頻碼率,深挖“窄帶高清”的實現原理》


盡量降低視頻碼率又不影響視頻的主觀觀看質量,這是視頻平臺最關心的問題之一,因為降低碼率意味著視頻播放帶寬的下降,節約成本。

2018年3月,又拍雲自研的“窄帶高清”功能,通過碼率控制優化,讓視頻在主觀質量不受影響的情況下,高效降低30%視頻碼率。窄帶高清通過視頻內容復雜度算法來確定視頻應用場景,繼而確定該場景下最優視頻編碼參數,輔助於碼率控制算法,最終達到視頻碼率控制與帶寬優化這個目的。

窄帶高清可以有效提升視頻播放平臺終端用戶視頻打開速度,並且減少視頻分發在帶寬成本的上的消耗。

為什麽窄帶高清可以節省流量

一般來說,視頻轉碼所需的成本比視頻播放帶寬少很多。因此通過視頻轉碼來降低帶寬成本成為可能,窄帶高清就是建立在這個大前提下的一個功能。通過窄帶高清功能可以節省30%的視頻碼率,大大降低直播、點播等業務場景下的帶寬成本。

技術分享圖片 △ 左為源視頻,右為窄帶高清(詳見視頻演示)

窄帶高清是如何實現

實現窄帶高清有兩個優化方向,1.在相同碼率的情況下提升視頻質量;2.在主觀質量不受損失的情況下,盡可能降低視頻碼率。

根據實際業務需求,又拍雲的“窄帶高清”功能采用了第二種思路,即保持視頻質量,降低碼率。

場景劃分

首先我們需要對視頻進行內容復雜度分析,獲取場景信息,取得視頻空間域的復雜度和時間域的復雜度,然後獲得視頻序列最終的復雜度,最終確定視頻編碼場景。

為什麽要進行場景劃分呢?

下文我們以場景運動劇烈和平緩的視頻為例,跟大家解釋一下場景劃分的原因。

技術分享圖片 △ 平緩視頻、劇烈視頻的碼率分析(psnr)

從上圖可以看出,在相同質量下,場景運動緩慢的視頻比場景運動劇烈的視頻,所需碼率少很多,這就是場景劃分的意義所在。

目前我們對手機拍攝視頻、動畫、商業動作大片、影視劇、在線教育、綜藝節目等視頻場景進行測試,獲取常見場景下視頻內容的編碼復雜度。

另外在高碼率的時候,碼率增加對視頻質量的提升比較少,因此只要找到合適碼率,那麽視頻低碼率下的質量和高碼率下的質量是相差無幾的,這是窄帶高清的理論基石。

碼率控制算法研究

碼率控制算法是視頻編碼器中非常重要的部分,學術上,碼率控制算法分為兩種:CBR(Constant Bit Rate,恒定碼率)和VBR(Variable Bit Rate,可變碼率)。考慮到業務需求是在主觀質量不變的情況下,降低視頻文件大小,又拍雲“窄帶高清”功能采用VBR的方式,並做了如下設定提升整體畫質的表現:

  • 視頻運動緩慢的時候,使用更低的碼率;運動劇烈的時候,使用更高的碼率;
  • 視頻圖像內部,靜止的部分分配更少的碼率;運動的部分分配更多的碼率。

通俗的說,把碼率放在該用的地方,不浪費每一個比特,實現更低的碼率,更清晰的畫質,更小的文件尺寸。

視頻編碼器優化

如何對視頻編碼器進行優化,又拍雲通過客觀質量評價加主觀質量評價想結合的辦法來制定視頻編碼器優化標準。

視頻質量評價作為視頻領域熱門的研究方向之一,分成主觀質量評價和客觀質量評價兩類。

主觀質量評價,即通過人工觀察者直接觀察視頻,在主觀打分,對視頻質量的好壞進行分級,該方法必須嚴格的測試環境實施步驟復雜,而且對觀察者要有一定的專業要求,因此實施起來需要巨大的代價,一般會用在科研機構小規模的算法驗證。

而對海量視頻數據和工業界來說,客觀質量評價是更好的選擇。PSNR(Peak Signal to Noise Ratio,峰值信噪比),是基於數學統計特性的評價方法,基於獨立的像素差值,忽略序列內容對失真可見度的影響,因而會出現和主觀感知的視頻質量的一致性存在差異。但是算法簡單,易於操作,且大規模應用。

針對PSNR的缺點,Zhou Wang等人實現了亮度、對比度和結構失真相互獨立的質量評價方法SSIM,得到更接近人眼視覺特性的評價指標。但是依然是過於簡單,屏蔽掉了HVS的其他生理特性。

視頻編碼器的參數數量很多,紛繁復雜,為了得到最佳的優化組合,我們用了客觀質量評價算法PSNR(Peak Signal to Noise Ratio,峰值信噪比)和SSIM(Structural SIMilarity,結構相似度),主觀質量評價算法VMAF(Video Multi-Method Assessment Fusion),再配合人工主觀質量評價的方式,獲取了常見場景下視頻編碼器的參數優化方案。

又拍雲窄帶高清,融合了以上幾種客觀和主觀的評價方法,在編碼器優化過程中,獲取碼率和視頻質量的平衡。

目前,絕大多數視頻還是使用H.264/AVC視頻編碼標準,更先進的H.265/HEVC和VP9的普及度還不夠。因此又拍雲“窄帶高清”功能優先支持了H.264視頻編碼格式,未來將支持H.265格式。

學術界還有許多碼率方面的研究成果,比如基於ROI(Region of Interest,感興趣區域)和HVS(Human Visual System,人眼視覺系統)的碼率控制,這些成果和技術,又拍雲也將積極融入到相關產品和解決方案中。

推薦閱讀:

愛奇藝第一季度又燒了11個億元,什麽時候是個頭? 平均節省流量 30% ,這項視頻雲處理技術是如何實現的??

深挖“窄帶高清”的實現原理