【H264/AVC 句法和語義詳解】(五)：Exp-Golomb指數哥倫布編碼（理論篇）

阿新 • • 發佈：2018-12-28

版權宣告：本文為博主原創文章，未經博主允許不得轉載。 https://blog.csdn.net/u011399342/article/details/80472399
本篇隸屬於文集：《H264/AVC 句法和語義詳解》，檢視文集全部文章，請點選文字連結。
想看最新文章，可以直接關注微信公眾號：金架構

上篇我們說過，學習描述子是解析h264句法元素的第一步。而在描述子中，除了順序讀取若干位元的b(8)、f(n)、i(n)、u(n)，指數哥倫布編碼也是使用頻率很高的編解碼方法。

因為指數哥倫布編碼(Exponential-Golomb)屬於熵編碼(Entropy encoding)，所以我們先大致介紹一下熵編碼，然後再進行細化。

1. 熵編碼（Entropy encoding）
熵（shang）編碼屬於無損編碼，它聽著很高大上，其實簡單來說，就是代表了一類編碼方法。熵編碼包括的編碼方法有：夏農-範諾編碼、霍夫曼編碼、算術編碼、指數哥倫布編碼、CAVLC、CABAC等，這一類編碼方法的宗旨，就是找到一種編碼，使得碼字的平均碼長達到熵極限。

具體實施起來就是，對出現概率較大的符號，取較短的碼長，而對出現概率較小的符號取較大的碼長。這就是熵編碼的中心思想，只要我們記住這一點，即使不瞭解“熵”是指啥，也能掌握上述幾種熵編碼。

不過我們還是簡單介紹一下，“熵”是指啥？

1.1 熵
熵在熱力學中，是表示分子狀態混亂程度的物理量，這時的熵稱為熱熵。後來資訊理論之父夏農（C. E. Shannon）把“熵”這一詞引入到資訊理論中，稱為“資訊熵”，資訊越是隨機，它的熵值越高。資訊熵也是我們在h264這樣的數字影象編碼中使用的概念。因為我們待編碼的影象畫素資訊、碼流的各個句法元素值，其實都屬於資訊。

而資訊熵，就是為了解決資訊的量化度量問題，它描述了整個信源的平均資訊量。資訊熵在我們的熵編碼中，表示了信源無損編碼後平均碼長的下限。所以我們上面才說，熵編碼就是為了使編碼後，碼字的平均碼長儘量達到熵極限。而且平均碼長越接近熵，說明熵編碼的壓縮效率越高。

1.2 熵和熵編碼
如果第一次接觸熵，確實不好理解。因為它不僅涉及到資訊學的知識，還有概率論的知識。不過雖然熵不好理解，但是熵編碼很好掌握。熵其實就相當於內功，而熵編碼是招式。待我們學過熵編碼，再來理解熵，就容易多了。

1.3 熵編碼分類
為了便於理解，上述說的多個熵編碼方法，還可以分為以下兩類：

（1）變長編碼：夏農範諾編碼、霍夫曼編碼、指數哥倫布編碼、CAVLC

（2）算術編碼、CABAC等算術編碼

而且這些熵編碼方法中，在H.264中應用的有：指數哥倫布編碼、CAVLC、算術編碼、CABAC。

2. 指數哥倫布編碼（編碼過程）
指數哥倫布編碼是一種較簡單的編碼方法，正常來說，它可以拓展至K階，也即K階指數哥倫布編碼。而在H.264中使用的，是0階指數哥倫布編碼，也即K等於0。下面我們就重點介紹0階指數哥倫布編碼，理解了0階，K階自然而然就懂了。

值得注意的是，在H.264中，0階指數哥倫布編碼，對應的描述子是ue(v)。只不過ue(v)代表的是解碼過程，而我們下面先從編碼開始。

2.1 0階指數哥倫布編碼
這個編碼過程如下圖所示：

0階指數哥倫布編碼過程

圖中應該寫的很清楚，我們以待編碼碼號code_num = 3為例：

第一步：將code_num +1, 即3+1 = 4

第二步：將4寫為二進位制的形式：100

第三步：計算100的位元個數為3，在100前面寫（3-1）個0，得到編碼碼字：00100

並且圖中背景為灰色區域，表示連續的碼字長度一樣，總結起來如下：

0階碼號與碼字總結

可以看到，碼字的結構形式可以表示為，中間位元為1，兩端位元個數對稱的平衡結構：

[N個0][1][INFO] 或者 [Prefix 字首][1][Suffix 字尾]
2.2 K階指數哥倫布編碼
由上述的0階，我們可以輕鬆拓展至K階，還是剛才那個步驟，只不過將第一步稍微改變一下：

（1）K階的第一步：將code_num 加上2k

（2）將code_num + 2k 寫為二進位制的形式

（3）計算二進位制的位元個數 M，並在前面加上M-1個0，得到編碼碼字。

如果要驗證一下，則將k=0代入上述步驟，就可以得到0階編碼的碼字。比如以K=0、K=1、K=2或K=3舉例如下：

K階指數哥倫布編碼舉例

表中x即為上述的待編碼碼號code_num。

3. 指數哥倫布編碼（解碼過程）
講過了編碼過程，我們就從解碼過程考慮考慮，這一過程描述在h264協議的9.1節，這也是我們今天的重點。因為H.264中的描述子，代表瞭解碼過程。所以下面我們就以描述子為主線，依次介紹H.264中的4個指數哥倫布編碼描述子：ue(v)、se(v)、me(v)、te(v)。

3.1 ue(v)
在h264中，ue(v)就代表了0階指數哥倫布編碼，通常被稱為無符號指數哥倫布編碼。對比我們上述的0階編碼過程，我們可以反過來研究研究解碼過程。如下圖：

ue(v)解碼

如圖，如果我們仔細觀察推理，就會發現碼字和code_num之間，有以下公式：

codeNum = 2leadingzerobits − 1 + read_bits( leadingZeroBits )
其中leadingZeroBits為中間1前面，0的個數。所以在解碼的時候，如果遇到描述子為ue(v)，則可以先數0的個數，數到1為止，其中0的個數即為leadingZeroBits。而公式中的read_bits( leadingZeroBits )，則為從中間1開始，往後順序數leadingZeroBits個位元位。

利用上述公式，就可以計算出codeNum的值。

所以上表的解碼過程為：

ue(v)解碼過程

當描述子為ue(v)時，codeNum的值即為語法元素的值。

3.2 se(v)
se(v)也稱有符號指數哥倫布編碼，所以當描述子為se(v)時，它的輸出有可能為負。而且當描述子為se(v)時，它的輸入為上述過程解析出來的codeNum。意思是什麼呢？如果遇到se(v)，需要先呼叫ue(v)，得出codeNum的值。然後呼叫se(v)的解析過程，se(v)的輸出即為語法元素的值。

se(v)的計算過程

如上表所示，表中第一列codeNum為輸入，第二列為輸出。計算公式則為：

語法元素值 = (−1)k+1 Ceil( k÷2 )
式中Ceil為向上取整，k為codeNum的值，代入即可計算出語法元素的值。

3.3 me(v)
me(v)也稱對映指數哥倫布編碼，聽著很高大上，其實就是拿著codeNum的值去查表。而且在H.264中，只有語法元素coded_block_pattern的值，是使用me(v)解析的。

而且當句法元素ChromaArrayType的值為1或2時，查表a。ChromaArrayType的值為0或3時，查表b。當巨集塊預測模式為Intra_4x4（幀內4x4）、Intra_8x8（幀內8x8）或者Inter（幀間編碼）時，輸出的coded_block_pattern的值也不同。

部分a表如下：

me(v) 表（a）部分資料

注意輸入為codeNum，輸出為coded_block_pattern的值。

3.4 te(v)
te(v)也稱截斷（舍位）指數哥倫布編碼，之所以這麼說呢，是因為它的編碼分為兩段。在H.264協議中，只有7.3.5.1節的巨集塊預測和7.3.5.2節的子巨集塊預測中，使用這種模式編碼，我們先看看它的編碼過程。

3.4.1 te(v)編碼過程
編碼時：

如果語法元素的值為0，則編碼為1，如果語法元素值為1，則編碼為0，此時佔用1個位元位。

如果語法元素的值大於1，則使用ue(v)進行編碼。

3.4.2 te(v)解碼過程
知道了編碼過程，解碼過程就好理解了。解碼時，需要先判斷語法元素值的取值範圍的上限，其中取值範圍為[0，x]。

如果上限值x大於1，那麼te(v)的輸出，也即語法元素的值，和ue(v)的輸出相同。

否則上限值x等於1，那麼te(v)的輸出，也即語法元素的值，等於讀入下一位位元值的取反，也即：

b = read_bits( 1 )

codeNum = !b

其中codeNum為te(v)輸出值，也即語法元素值。

4. 總結
其實由上面的分析，就可以看出，指數哥倫布編碼的壓縮率其實是比較低的，有時候甚至沒有壓縮效果。所以指數哥倫布編碼在H.264中，主要應用在部分語法元素的編解碼和二值化（將語法元素的值轉為二進位制），而在h264中壓縮比比較高的熵編碼方法，是還未介紹的CAVLC和CABAC。
---------------------
作者：金架構
來源：CSDN
原文：https://blog.csdn.net/u011399342/article/details/80472399
版權宣告：本文為博主原創文章，轉載請附上博文連結！

【H264/AVC 句法和語義詳解】(五)：Exp-Golomb指數哥倫布編碼（理論篇）

【H264/AVC 句法和語義詳解】(五)：Exp-Golomb指數哥倫布編碼（理論篇）

詳解Linux下auto工具製作Makefile原始碼包（製作篇）

【H.264/AVC視訊編解碼技術詳解】二十三、幀間預測編碼(1)：幀間預測編碼的基本原理

Oracle數據庫的安裝【超詳細的文圖詳解】

【論文詳解】DPED：DSLR-Quality Photos on Mobile Devices with Deep Convolutional Networks

3天搞定的小型B/S內部管理類軟體定製開發專案【軟體開發實戰10步驟詳解】

【磁碟及檔案系統管理詳解】

【最小乘積生成樹詳解】【BZOJ2395】

TCP協議詳解（理論篇）

ALSA音效卡驅動中的DAPM詳解之五：建立widget之間的連線關係

《TCP/IP詳解卷一：協議》資料鏈路層（一）

詳解介紹Selenium常用API的使用--Java語言（完整版）

圖文詳解MyEclipse中新建Maven webapp專案的步驟（很詳細）

詳解_動態規劃DAG_硬幣找零問題（完全揹包）

重磅 | 詳解深度強化學習，搭建DQN詳細指南（附論文）

javacv開發詳解之1：呼叫本機攝像頭視訊（建議使用javaCV1.3版本）

Google官方MVP+Dagger2架構詳解----非常詳細，值得多看幾遍（okhttp cache）

C# 9.0新特性詳解系列之一：只初始化設定器（init only setter)

【SSH2框架（理論篇）】--SSH2 Vs 經典三層

【轉】PANDAS 數據合並與重塑（concat篇）

【H264/AVC 句法和語義詳解】(五)：Exp-Golomb指數哥倫布編碼（理論篇）

相關推薦