即時通訊音視訊開發（四）：視訊編解碼之預測技術介紹

阿新 • • 發佈：2018-11-14

前言

即時通訊應用中的實時音視訊技術，幾乎是IM開發中的最後一道高牆。原因在於：實時音視訊技術 = 音視訊處理技術 + 網路傳輸技術的橫向技術應用集合體，而公共網際網路不是為了實時通訊設計的。

系列文章

1. 預測技術的作用

目的是去除空間冗餘和時間冗餘。因為視訊存在大量的空間冗餘和時間冗餘，包括空間冗餘、時間冗餘，預測後得到去除大部分空間或時間冗餘的殘差。

2. 空間冗餘

影象空間相鄰畫素具有很強的相關性，幀內預測技術去除空間冗餘。

104906jo7xhmli7ou77207.png (576Ã272)

3. 亮度預測模式

104951qaabbaz222sv2bby.png (576Ã284)

104952ekkkau4iagu4n5gy.png (548Ã596)

104952vxwxwan4sf5jwdz7.png (576Ã375)

4. 色度預測模式

105041fzymtigmmcotx4ta.png (576Ã363)

105041rjrrf1abkxcvvvd0.png (576Ã360)

5. 時間冗餘

視訊影象在時間上有較強的相關性，即存在時間冗餘。去除時間冗餘的編碼技術有：運動估計（Motion Estimation，ME）、運動補償（Motion Compensation，MC）。

105407swrb8bienmecnrr8.png (562Ã477)

6. 運動模型

105501icz1tc4p1zapxaxk.png (576Ã270)

105537jpei6bwdd6bdz66d.png (576Ã356)

105543ka5a6z6xkz53x9kx.png (576Ã488)

7. 匹配準則

105644w7yhkq3oy7qol66k.png (576Ã257)

8. 運動估計

目的是去除視訊影象的時間冗餘。運動估計在搜尋範圍內為當前塊尋找匹配最好的預測塊，全搜尋方式的運動估計計算複雜度高。

105746kufbzh1nuaa4gzvv.png (455Ã467)

9. 快速運動估計演算法種類

在保持預測精度的同時減少運動估計的搜尋次數，典型演算法有：

三步搜尋（Three Step Search，TSS）
二維Log搜尋（2D Logarithmic Search，2DLOG）
正交搜尋（Orthogonal Search Algorithm，OSA）
十字搜尋（Cross Search Algorithm，CSA）
新三步搜尋（New Three Step Search，NTSS）
四步搜尋（Four Step Search，FSS）
共軛方向搜尋（Conjugate Direction Search，CDS）
梯度下降搜尋（Gradient Descent Search，GDS）

層次塊搜尋（Hierarchical Block Matching Algorithm，HBMA）

10. 搜尋演算法複雜度比較

110000x0nvvcin881t8j7v.png (576Ã305)

11. 分畫素運動估計與運動補償

時域運動位置更可能在整象素之間，即分畫素上。利用相鄰的整象素可以估計出分象素的值：常用線性或雙線性插值得到分象素的值。分象素運動估計有更高的預測精度，但複雜度也更高：1/2分象素運動估計，影象儲存空間增加4倍，運動向量需要放大2倍，1/4分象素運動估計，影象儲存空間增加16倍，運動向量需要放大4倍，計算複雜度也成倍增加。

110127ihmhho2ykbmmko6c.png (576Ã358)

12. 分畫素插值

110158uuz5cifzbkec1zef.png (576Ã227)

13. 多參考幀預測

有更多的候選影象，搜尋更精確的預測塊。

110249tvaq42d06f6kqnkl.png (576Ã236)

14. 影象分塊編碼

110335qqi33r5z93nn09vw.png (576Ã412)

110347pc88nn3c64ynynf5.png (576Ã425)

視訊內容的運動非常複雜，影象分塊編碼可以更好的提高運動預測精度，提高壓縮效率。要在編碼塊大小和附資訊（MV，Mode）編碼位元數之間權衡，小的編碼塊大小會有更好的預測但有更多的附資訊位元數。

110436hoxj1xxkksssxjzr.png (576Ã188)

15. 雙向預測編碼

110509mva9v7eiae03qzk7.png (576Ã386)

16. B幀有更好的編碼效率

新出現的物件參考將來的幀有更好的預測效果，前後兩個預測的平均值可以減少預測方差。

110630nw57ssz37w904a0e.png (576Ã276)

17. 全域性運動估計

基於全域性仿射運動模型。預測精度不如基於塊的運動估計。MV數目少，適合簡單運動場景的運動估計。

110713phese8u8877l8zn5.png (576Ã264)

網易雲信，你身邊的即時通訊和音視訊技術專家，瞭解我們，請戳網易雲信官網

想要閱讀更多行業洞察和技術乾貨，請關注網易雲信部落格

本文轉載自52im,作者：JackJiang

即時通訊音視訊開發（四）：視訊編解碼之預測技術介紹

前言即時通訊應用中的實時音視訊技術，幾乎是IM開發中的最後一道高牆。原因在於：實時音視訊技術 = 音視訊處理技術 + 網路傳輸技術的橫向技術應用集合體，而公共網際網路不是為了實時通訊設計的。系列文章《即時通訊音視訊開發（二）：視訊編解碼之數字視訊介紹》《即時通訊音

即時通訊音視訊開發（三）：視訊編解碼之編碼基礎

前言即時通訊應用中的實時音視訊技術，幾乎是IM開發中的最後一道高牆。原因在於：實時音視訊技術 = 音視訊處理技術 + 網路傳輸技術的橫向技術應用集合體，而公共網際網路不是為了實時通訊設計的。系列文章《即時通訊音視訊開發（一）：視訊編解碼之理論概述》《即時通訊音視訊

即時通訊音視訊開發（二）：視訊編解碼之數字視訊介紹

前言即時通訊應用中的實時音視訊技術，幾乎是IM開發中的最後一道高牆。原因在於：實時音視訊技術 = 音視訊處理技術 + 網路傳輸技術的橫向技術應用集合體，而公共網際網路不是為了實時通訊設計的。系列文章本文是系列文章中的第2篇，本系列文章的大綱如下：《即時

即時通訊音視訊開發（一）：視訊編解碼之理論概述

即時通訊音視訊開發（十）：實時語音通訊的迴音消除技術詳解

前言即時通訊應用中的實時音視訊技術，幾乎是IM開發中的最後一道高牆。原因在於：實時音視訊技術 = 音視訊處理技術 + 網路傳輸技術的橫向技術應用集合體，而公共網際網路不是為了實時通訊設計的。系列文章《即時通訊音視訊開發（八）：常見的實時語音通訊編碼標準》《即時通訊

即時通訊音視訊開發（九）：實時語音通訊的迴音及迴音消除概述

前言即時通訊應用中的實時音視訊技術，幾乎是IM開發中的最後一道高牆。原因在於：實時音視訊技術 = 音視訊處理技術 + 網路傳輸技術的橫向技術應用集合體，而公共網際網路不是為了實時通訊設計的。系列文章《即時通訊音視訊開發（七）：音訊基礎及編碼原理入門》《即時通訊音視

即時通訊音視訊開發（八）：常見的實時語音通訊編碼標準

前言即時通訊應用中的實時音視訊技術，幾乎是IM開發中的最後一道高牆。原因在於：實時音視訊技術 = 音視訊處理技術 + 網路傳輸技術的橫向技術應用集合體，而公共網際網路不是為了實時通訊設計的。系列文章《即時通訊音視訊開發（六）：如何開始音訊編解碼技術的學習》《即時通

即時通訊音視訊開發（七）：音訊基礎及編碼原理入門

前言即時通訊應用中的實時音視訊技術，幾乎是IM開發中的最後一道高牆。原因在於：實時音視訊技術 = 音視訊處理技術 + 網路傳輸技術的橫向技術應用集合體，而公共網際網路不是為了實時通訊設計的。系列文章《即時通訊音視訊開發（五）：認識主流視訊編碼技術H.264》《即時

即時通訊音視訊開發（六）：如何開始音訊編解碼技術的學習

前言即時通訊應用中的實時音視訊技術，幾乎是IM開發中的最後一道高牆。原因在於：實時音視訊技術 = 音視訊處理技術 + 網路傳輸技術的橫向技術應用集合體，而公共網際網路不是為了實時通訊設計的。系列文章《即時通訊音視訊開發（四）：視訊編解碼之預測技術介紹》《即時通訊音

即時通訊音視訊開發（五）：認識主流視訊編碼技術H.264

前言即時通訊應用中的實時音視訊技術，幾乎是IM開發中的最後一道高牆。原因在於：實時音視訊技術 = 音視訊處理技術 + 網路傳輸技術的橫向技術應用集合體，而公共網際網路不是為了實時通訊設計的。系列文章《即時通訊音視訊開發（三）：視訊編解碼之編碼基礎》《即時通訊音視訊

Qt移動應用開發（四）：應用粒子特效

ons -i 遊戲 direct mit class png pop 狀態 Qt移動應用開發（四）：應用粒子特效上一篇文章介紹了Qt Quick是如何對幀動畫進行支持的。幀動畫的實現離不開狀態機、而狀態機、動畫和狀態切換（transition

星雲鏈智能合約開發（四）：在星雲鏈上發送交易

星雲鏈智能合約開發在星雲鏈上發送交易準備賬戶在星雲鏈上，每個地址表示一個唯一的賬戶，一一對應。在發送交易前，我們需要準備兩個賬戶：一個賬戶用來發送代幣 (稱為"from") 和另一個賬戶來接受代幣 (稱為"to"). 發送者賬戶在這裏，我們將會使用配置

Python爬蟲開發（四）：動態載入頁面的解決方案與爬蟲代理

0×00 前言如果讀者讀過我前面的關於爬蟲的文章，應該大概都清楚我們現在可以對一個靜態的web頁面”為所欲為“了，但是技術的發展總是沒有止境的，僅僅是這樣對靜態頁面處理遠遠不夠，要知道現在很多的web頁面有意無意為了防止靜態爬蟲使用ajax技術動態載入頁面，這就導致了在面對這些網站的時候，我們

web前端基礎教學視訊分享（四）jquery視訊教學+練習原始碼

【寫在前面】梅雪爭春未肯降，騷人閣筆費評章。好文待評如君意，執筆書她黛月迷。實在編不下去了，哈哈哈哈【分享與你】有教學視訊和相關視訊的demo，這3塊錢當時買的簡直良心啊連結：https://pan.baidu.com/s/1wHDZ3n1LTn2sL1vGe7RJAA 提取

FFmpeg中的濾鏡（四）：視訊濾鏡 -- subtitles

subtitles 描述：該濾鏡呼叫libass庫，講字幕添新增到輸入視訊中。如果要使用該濾鏡，需要在編譯FFmpeg時使用--enable-libass配置項。這個濾鏡需要配合使用 libavcodec和libavformat將輸入的字幕檔案轉換為ASS(ASS格式見

Python網路爬蟲（四）：視訊下載器

這一節實現一個下載 iqiyi VIP視訊的爬蟲。需要的準備：旋風視訊VIP解析網站或其他解析網站原理理解：在視訊解析網站獲取視訊的過程中，首先會向視訊伺服器傳送GET請求，獲得伺服器發來的資訊；接到資訊後，再向伺服器POST資料，即將類似於密碼

微信開發（四）：獲取access_token和微信伺服器IP

獲取access_token和微信伺服器IP access_token access_token是公眾號的全域性唯一介面呼叫憑據，公眾號呼叫各介面時都需使用access_token ac

iOS開發（swift）：頁面跳轉之設定第一次執行的介面

0.介面回顧 1.在AppDelegate檔案中新增如下程式碼 import UIKit @UIApplicationMain class AppDelegate: UIResponder, UIApplicationDelegate {

Cris 複習Python日記（四）：Python 資料結構之序列和列表

1. 簡單認識序列和列表 # 序列 # 序列是Python 中最基本的資料結構，用於儲存一組有序的資料，所有資料都在序列中擁有一個唯一索引，並且按照元素新增的順序來指定序列 # 序列的分類 # 1.

David Silver強化學習公開課（四）：不基於模型的預測

簡介 Introduction 通過先前的講解，我們明白瞭如何從理論上解決一個已知的MDP：通過動態規劃來評估一個給定的策略，並且得到最優價值函式，根據最優價值函式來確定最優策略；也可以直接進行不基於任何策略的狀態價值迭代得到最優價值函式和最優策略。從本講開始將花連續兩

即時通訊音視訊開發（四）：視訊編解碼之預測技術介紹

前言

系列文章

1. 預測技術的作用

2. 空間冗餘

3. 亮度預測模式

4. 色度預測模式

5. 時間冗餘

6. 運動模型

7. 匹配準則

8. 運動估計

9. 快速運動估計演算法種類

10. 搜尋演算法複雜度比較

11. 分畫素運動估計與運動補償

12. 分畫素插值

13. 多參考幀預測

14. 影象分塊編碼

15. 雙向預測編碼

16. B幀有更好的編碼效率

17. 全域性運動估計

相關推薦