1. 程式人生 > >超解析度重建——關於多尺度結構相似性

超解析度重建——關於多尺度結構相似性

今天在讀文章的過程中看了一篇關於多尺度結構相似性在超解析度重建方面使用的文章,對裡面一些詞感覺生澀。

1、何為結構相似性

2、多尺度的含義,何為相同尺度影象相似塊,何為不同尺度影象相似塊

先說結構相似性,在之前的實驗中,一直是以PSNR作為重建質量的參考指標,最近幾篇文章看到了很多用結構相似性來做權衡的。

結構相似性SIM(Structural Similarity),所謂的結構,比如你看到一幅圖中比如說街道,這是有明顯的結構特徵的,所以也可以使用重建前後兩幅影象的結構特徵,來判斷影象重建結果的好壞。相比於PSNR更注重均方誤差,即整幅影象的灰度資訊,SIM在結構性方面更注重一些。重建後圖像和原高清影象的結構相似圖可以用公式表示為:


其中 為均值,為方差,為協方差,C1,C2為保證分母不為0的小常數。顯然值越大越好,最大為1。

再說多尺度,在部落格搜到這麼篇文章挺好的,與大家分享

本文轉自:http://blog.csdn.net/chgm_456d/article/details/8100513

我一開始以為  多尺度與多解析度  是一樣的意思。後來看到了xiaowei_cqu部落格的一篇文章“【OpenCV】SIFT原理與原始碼分析:DoG尺度空間構造”(以下簡稱,xiaowei一文),才發現我的理解有誤。

尺度空間(scale space)理論

要理解多尺度,首先要知道什麼是尺度空間。xiaowei一文中提到,自然界中的物體呈現出不同的形態,需要不同的尺度觀測。比如,建築物用“米”測量,原子用“納米”。比較形象的是,在平常使用的Google地圖,可以滑動滑鼠來改變地圖的尺度;照相機通過調焦,將景物拉近拉遠。尺度空間中各尺度影象的模糊程度逐漸變大,模擬了景物由近到遠在視網膜形成過程。

為什麼要討論尺度空間?因為計算機在不知道影象尺寸的情況下,需要考慮多尺度以獲取興趣物體的最佳尺度。同時,在一幅影象的不同尺度下檢測出相同的關鍵點來匹配,即尺度不變性。

尺度空間表達——高斯模糊

David Lowe 2004年 在Int. Journal of Computer Vision 的經典論文(Distinctive Image Features from Scale-Invariant Keypoints)中,對尺度空間的定義:

“It has been shown by Koenderink (1984) and Lindeberg (1994) that under a variety of reasonable assumptions the only possible scale-space kernel is the Gaussian function. Therefore, the scale space of an image is defined as a function, L(x, y, σ), that is produced from the convolution of a variable-scale Gaussian, G(x, y, σ), with an input image, I (x, y)."

抽取要點:

1. 高斯核是唯一可以產生多尺度空間的核;

2. 一幅影象的尺度空間 L(x, y, σ), 定義為原始影象 I(x,y) 與一個可變尺度的2維高斯函式G(x, y, σ)卷積運算。

即尺度空間形式表示為:

其中,

(金字塔)多解析度表達——降取樣

影象金字塔化一般包括兩個步驟:使用低通濾波器平滑影象;對影象進行降取樣(通常是水平,豎直方向1/2),從而得到一系列尺寸縮小的影象。對於二維影象,每一層影象由上一層解析度的長、寬各一半,也就是四分之一的畫素組成。

多尺度和多解析度的區別
最大的不同:
    尺度空間表達是由不同高斯核平滑卷積得到,在所有尺度上有相同的解析度;
    而(金字塔)多解析度表達每層解析度減少固定比率。

所以,(金字塔)多解析度生成較快,且佔用儲存空間少;而多尺度表達隨著尺度引數的增加冗餘資訊也變多。
多尺度表達的優點在於影象的區域性特徵可以用簡單的形式在不同尺度上描述;而(金字塔)多分辨的表達沒有理論基礎,難以分析影象區域性特徵。