1. 程式人生 > >1.視頻壓縮編碼綜述

1.視頻壓縮編碼綜述

信息 png 兩種 變換 pan 結果 產生 不同的 減少

1.預測編碼

一幅圖像由許多個像素點組成,大量的統計表明,同一副圖像中像素之間具有較強的相關性。兩個像素之間的距離越短,則其相關性越強。即兩個像素的值越接近。於是,人們可以利用這種像素間的相關性進行壓縮編碼 技術分享圖片 例如,當前像素為X,可用a、b或c,或者三者的線性加權來預測。這些a、b、c被稱為參考像素。在實際傳送時,把實際像素X(當前值)和參考像素(預測值)相減。簡單起見傳送X-a,到了接收端再把(X - a) +a = X,由於a是已經傳送的(在接收端被存儲),於是得到當前值。由於X與a相似,X-a值很小,視頻信號被壓縮,這種壓縮方式稱為幀內預測編碼不僅如此,還可以用圖1.3所示的幀間相關性進行壓縮編碼。由於臨近幀之間的相關性一般比幀內像素間的相關性更強,壓縮比也更大。由此可見,利用像素之間(幀內)的相關性和幀間的相關性,即找到相應的參考像素或參考幀作為預測值,可以實現視頻壓縮編碼

2.變換編碼

大量統計表明,視頻信號中包含著能量上占大部分的直流和低頻成分,即圖像的平坦部分,也有少量的高頻成分,即圖像的細節。因此,可以用另一種方法進行視頻編碼,將圖像經過某種數學變換後,得到變換域中的圖像 技術分享圖片

其中u、v分別是空間頻率坐標,用‘o‘表示的低頻和直流占圖像能量中的大部分,而高頻成分(用‘X‘表示)則是少量的,於是可用較少的碼表示直流低頻和高頻而‘O‘則不必用碼,結果完成了壓縮編碼。

3.視頻編碼系統結構

技術分享圖片

視頻編碼方法與可采用的信源模型有關。如果采用“一幅圖像由許多像素構成”的信源模型,這種信源模型的參數就是每個像素的亮度和色度的幅度值。對這些參數進行壓縮編碼技術稱為基於波形的編碼
。如果采用一個分量有幾個物體構成的信源模型,這種信源模型的參數就是各個物體的形狀、紋理和運動。對這些參數進行壓縮編碼的技術被稱為基於內容的編碼
由此可見,根據采用信源模型,視頻編碼可以分為兩大類,基於波形的編碼和基於內容的編碼。它們利用不同的壓縮編碼方法,得到相應的量化前的參數;再對這些參數進行量化,用二進制碼表示其量化值;最後,進行無損熵編碼進一步提高碼率。解碼則為編碼的逆過程

4.基於波形的編碼

利用像素間的空間相關性和幀間的時間相關性,采用預測編碼和變換編碼技術可大大減少視頻信號的相關性,從而顯著降低視頻序列的碼率,實現壓縮編碼的目標。基於波形的編碼采用了把預測編碼和變換編碼組合起來的基於塊的混合編碼方法
。為了減少編碼的復雜性,使視頻編碼操作易於執行,采用混合編碼方法時,首先把一幅圖像分成固定大小的塊,例如塊 8×8(即每塊 8 行,每行 8 個像素)、塊 16×16(每塊 16 行,每行 16 個像素)等等,然後對塊進行壓縮編碼處理。
H.264編碼采用了基於塊的混合編碼法,屬於基於波形的編碼

5.基於內容的編碼

基於塊的編碼易於操作,但由於人為地把一幅圖像劃分成許多固定大小的塊,當包含邊界的塊屬於不同物體時,它們分別具有不同的運動,便不能用同一個運動矢量表示該邊界塊的運動狀態。如果強制劃分成固定大小的塊,這種邊界塊必然會產生高的預測誤差和失真,嚴重影響了壓縮編碼信號的質量。於是產生了基於內容的編碼技術。這時先把視頻幀分成對應於不同物體的區域,然後對其編碼。具體說來,即對不同物體的形狀、運動和紋理進行編碼。在最簡單情況下,利用二維輪廓描述物體的形狀;利用運動矢量描述其運動狀態;而紋理則用顏色的波形進行描述當視頻序列中的物體種類已知時,可采用基於知識或基於模型的編碼。例如,對人的臉部,已開發了一些預定義的線框對臉的特征進行編碼,這時編碼效率很高,只需少數比特就能描述其特征。對於人臉的表情(如生氣、高興等),可能的行為可用語義編碼,由於物體可能的行為數目非常小,可獲得非常高的編碼效率。MPEG-4 采用的編碼方法就既基於塊的混合編碼,又有基於內容的編碼方法

6.三維(立體)視頻編碼

立體視頻編碼是視頻編碼的發展方向之一,平面信息外增加了深度信息,數據量非常龐大。

立體視頻編碼也有兩種類型的方法:第一種是基於波形的,它組合運動補償預測和位差補償預。所謂位差估計即在兩幅不同圖像中尋找對應的點。它對預測殘差圖像、位差和運動矢量進行編碼;第二種是基於物體的,它直接對成像物體的三維結構和運動進行編碼。當物體結構簡單時,可獲得非常高的壓縮比。

技術分享圖片

1.視頻壓縮編碼綜述