術語“編解碼器 Coder/Decoder”是壓縮器/解壓縮器或編碼器/解碼器一詞的縮寫。顧名思義,編碼可使視訊檔案變小以進行儲存,然後在需要再次使用時將壓縮後的資料轉換成可用的影象。

視訊質量評價(VQA)是以人眼的主觀質量評估結果為依據,使用演算法模型對失真視訊進行評估。

傳 統的評估方法難以做到主觀評價結果與客觀評價結果相一致。基於深度學習的視訊質量評價方法無需加入 手工特徵,通過模型自主學習即可進行評估,對視訊質量的監控和評價有重要意義

計算機視覺的資料集開源下載

https://www.cnblogs.com/leoking01/p/13529027.html

https://blog.csdn.net/zh_JNU/article/details/79700219

近些年VQA(video quality assessment)論文發表情況CVPR、ICCV、ECCV

DVQA是騰訊多媒體實驗室設計的基於深度學習的全參考視訊質量評估演算法。在整個視訊鏈路中,我們可以量化大部分模組,如採集,上傳,預處理,轉碼,分發。我們最未知的卻恰恰是最關鍵的部分,即使用者的視訊觀看體驗。DVQA適用於在源參考視訊可用的場景下,精確衡量視訊內容的人眼感知質量。

C3DVQA所使用的網路結構如下圖所示。其輸入為損傷視訊和殘差視訊。網路包含兩層二維卷積來逐幀提取空域特徵。級聯後使用四層三維卷積層來學習時空聯合特徵。三維卷積輸出描述了視訊的時空掩蓋效應,我們使用它來模擬人眼對視訊殘差的感知情況:掩蓋效應弱的地方,殘差更容易被感知;掩蓋效應強的地方,複雜的背景更能掩蓋畫面失真。

網路最後是池化層和全連線層。池化層的輸入為殘差幀經掩蓋效應處理後的結果,它代表了人眼可感知殘差。全連線層學習整體感知質量和目標質量分數區間的非線性迴歸關係