論文學習 | 利用塊分割資訊增強壓縮視訊質量：Enhancing HEVC Compressed Videos with a Partition-Masked Convolutional Neural Network

阿新 • • 發佈：2018-11-13

一、亮點
二、網路
三、Mask 及其融合
四、結論

一、亮點

提出 partition-masked Convolutin Neural Network (CNN) ，用以提升 HEVC 壓縮視訊的質量。
其亮點在於：該網路利用編碼端提供的塊分割資訊，在解碼端進行質量增強。

而現存的質量提升方法中，大多要麼只在編碼端（環路濾波器），要麼只在解碼端（一般 CNN 方法）。

However, existing works only consider the appearance of input coding units
(CUs) or frames, while the partition variations in different CUs and frames are neglected.

塊分割資訊，實際上暗示了 visual compression artifacts 的來源。因此塊分割資訊可以用於質量增強。

In practice, since the partition information (e.g., 1616, 88) is introduced by the blockwise processing and quantization of HEVC, this indicates the source of visual compression artifacts.

Thus, we use the partition information to effectively guide the quality enhancement process performed by CNN.

Since the block-wise transform and quantization are performed in HEVC during encoding, the quality degradation of compressed frames is highly related to the coding unit splitting.

Thus, the partition information contains useful clues for eliminating the artifacts present during the encoding.

二、網路

General network

塊分割資訊，經過 mask generation 後，得到 mask 。
mask 和待增強的幀分別進行特徵提取，再融合，最終生成“質量更高”的幀。

其 CNN 網路如圖：

CNN

這個網路看圖很好懂，不復雜。作者還強調了其中殘差網路的深度，使其可以學到更多有意義的資訊。

三、Mask 及其融合

作為本文的第二個貢獻，作者首先提出並對比了兩種 mask 。
第一種是 Mean-based mask ，第二種是 Boundary-based mask ，如圖。

Fusion

在邊界 mask 中，邊界寬度為2，用 1 填滿；其餘部分為 0 。
沒有太多的說道。唯一的說法是：由於 mask 的塊之間差異很大，因此可以借鑑許多有意義的資訊？

其次，作者提出了 3 種融合方式：

分別經過 CNN ，得到各自的 feature map 再相加，即 Add-based fusion
在輸入 CNN 前，作為不同的通道相加，再輸入 CNN ，即 Concatenate-based fusion
類似於第一種方式，但由於 mask 資訊量較少，因此對 mask 只做 3 層卷積，稱為 Early fusion

在20個標準測試序列上的實驗結果表面，MM + AF 效果最優。

四、結論

本文基本沒有數學，但利用塊分割資訊進行解碼端質量增強的思路值得借鑑。

論文學習 | 利用塊分割資訊增強壓縮視訊質量：Enhancing HEVC Compressed Videos with a Partition-Masked Convolutional Neural Network

目錄一、亮點二、網路三、Mask 及其融合四、結論一、亮點提出 partition-masked Convolutin Neural Network (CNN) ，用以提升 HEVC 壓縮視訊的質量。其亮點在於：該網路利用編碼端提供的塊分割資訊，在解碼端進行質量增強。

[論文學習]An Effective Approach for Mining Mobile User Habits：一種高效挖掘移動使用者習慣的方法

原文： Cao H, Bao T, Yang Q, et al. An effective approach for mining mobile user habits[C]//Proceedings of the 19th ACM international confere

【論文筆記1】RNN在影象壓縮領域的運用——Variable Rate Image Compression with Recurrent Neural Networks

一、引言隨著網際網路的發展，網路圖片的數量越來越多，而使用者對網頁載入的速度要求越來越高。為了滿足使用者對網頁載入快速性、舒適性的服務需求，如何將影象以更低的位元組數儲存（儲存空間的節省意味著更快的傳輸速度）並給使用者一個低解析度的thumbnails（縮圖）的previ

論文筆記-DeepFM: A Factorization-Machine based Neural Network for CTR Prediction

contain feature 比較 san date res 離散 edi post 針對交叉（高階）特征學習提出的DeepFM是一個end-to-end模型，不需要像wide&deep那樣在wide端人工構造特征。網絡結構： sparse feature

Deep Learning 學習隨記（八）CNN（Convolutional neural network）理解

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

深度學習（三）Convolutional Neural Network

What is Deep Learning 認識任何事物之前最好了解這一事物在我們的知識認知體系中所處的位置，這樣有助於將其歸納到自己的認知體系中，產生聯絡並編製成類似於知識圖譜樣的結構，不用記住也不好忘記。

MSCNN論文解讀-A Unified Multi-scale Deep Convolutional Neural Network for Fast Object Detection

多尺度深度卷積神經網路進行快速目標檢測：兩階段目標檢測器，與faster-rcnn相似，分為an object proposal network and an accurate detection network. 文章主要解決的是目標大小不一致的問題，尤其是對小目標的檢測，通過多

論文筆記《The application of two-level attention models in deep convolutional neural network for FGVC》

這篇文章是2015年的，作者使用提出了兩級注意力的方法，來進行細粒度分類。以鳥類分類為例。作者在object-level和part-level兩個級別分別對鳥進行分類，將得到的分數相加綜合後得到最後的分類結果。上圖是鳥分類在object-level的一個流程圖，先用select

Multi-View Gait Recognition Based on A Spatial-Temporal Deep Neural Network論文翻譯和理解

Multi-View Gait Recognition Based on A Spatial-Temporal Deep Neural Network論文翻譯和理解翻譯格式：一句英文，一句中文結合圖來講解 ABSTRACT ABSTRACT This paper p

論文翻譯------Stereo Matching by Training a Convolutional Neural Network to Compare Image Patches

原文介紹了一種基於深度學習的密集匹配方法MC-NET，是第一篇將深度學習引入密集匹配方面的文章。 **********************************************************手動分割線**********************

DeepFM: A Factorization-Machine based Neural Network for CTR Prediction 論文閱讀總結

Abstract Learning sophisticated feature interactions behind user behaviors is critical in maximizing CTR for recommender systems. Despite great

機器學習演算法篇--卷積神經網路基礎（Convolutional Neural Network）

假設輸入影象為如圖中右側的 5 × 5 矩陣，其對應的卷積核為一個 3 × 3 的矩陣。同時，假定卷積操作時每做一次卷積，卷積核移動一個畫素位置，即卷積步長為1。第一次卷積操作從影象 (0, 0) 畫素開始，由卷積核中引數與對應位置影象像素逐位相乘後累加作為一次卷積操作結果，即 1×1+2×0+3×1

[深度學習] 影象反捲積的深度積神經網路 Deep Convolutional Neural Network for Image Deconvolution

《影象反捲積的深度積神經網路》《Deep Convolutional Neural Network for Image Deconvolution》 Li Xu, Jimmy SJ. Ren, Ce Liu, Jiaya Jia NIPS 2014 pdf 摘要

論文筆記之《Event Extraction via Dynamic Multi-Pooling Convolutional Neural Network》

都是全連接級別語義泛化能力最好實現相同 2.4 1. 文章內容概述本人精讀了事件抽取領域的經典論文《Event Extraction via Dynamic Multi-Pooling Convolutional Neural Network》，並作出我的

論文閱讀：《Human Parsing with Contextualized Convolutional Neural Network》ICCV 2015

概述論文主要是提出了一個local-to-global-to-local 的框架結構，主要目的是從低層加入情境化的資訊，這個框架是將交叉層內容（cross-layer context），全域性影

論文解析《Deep Convolutional Neural Network Features and the Original Image》

這一篇論文詳細分析了人臉識別中CNN網路提取到的features有一些什麼樣的性質，一般人臉識別中CNN出來後面接一個線性層用交叉熵來分類，這裡的features值得就是cnn出來的512或者128維的浮點陣列。文章首先用這個features作為輸入，使用LDA來分類，預測頭

深度學習FPGA實現基礎知識10(Deep Learning（深度學習）卷積神經網路(Convolutional Neural Network，CNN))

第一點，在學習Deep learning和CNN之前，總以為它們是很了不得的知識，總以為它們能解決很多問題，學習了之後，才知道它們不過與其他機器學習演算法如svm等相似，仍然可以把它當做一個分類器，仍然可以像使用一個黑盒子那樣使用它。第二點，Deep Learning強大的地方就是可以利用網路中間某一

【論文閱讀】Accelerating the Super-Resolution Convolutional Neural Network

開發十年，就只剩下這套架構體系了！ >>>

python學習shutil模塊的文件壓縮和解壓用法

write 文件名 logger .data ner ase 否則 tar for shutil模塊可以創建壓縮包並返回文件路徑，例如 zip,tar,下面詳細其用法 base_name 壓縮包的文件名，也可以是壓縮包的路徑，只是文件名時，則保存至當前目錄，否則保存

《一種策略融合的跨語言文本情感傾向判別方法》論文學習筆記（大一下）

建立現象資源步驟特征選擇標簽標註障礙協同現象：因特網資源呈現多語言化和跨語言的特點，給普通用戶獲取非母語網絡信息造成障礙。目標：整合多語言傾向信息，以通用的數據形式讓用戶了解多語言數據對某個對象的評價。針對跨語言情感傾向分類任務，提出兩種跨語言

論文學習 | 利用塊分割資訊增強壓縮視訊質量：Enhancing HEVC Compressed Videos with a Partition-Masked Convolutional Neural Network

一、亮點

二、網路

三、Mask 及其融合

四、結論

相關推薦