1. 程式人生 > >《影象處理、分析與機器視覺》(第4版)閱讀筆記——第三章 影象及其數學與物理背景

《影象處理、分析與機器視覺》(第4版)閱讀筆記——第三章 影象及其數學與物理背景

3.1 概述

3.1.1 線性

向量(線性)空間(vector(linear) space)

3.1.2 狄拉克(Dirac)分佈和卷積

理想的衝擊是一個重要的輸入訊號,影象平面上的理想衝擊是用狄拉克分佈(Dirac distribution)定義的,\delta (x,y)。相當於訊號處理中的單位階躍函式或單位衝擊函式。

參考:https://blog.csdn.net/yuanmengxinglong/article/details/61930684                                           

離散卷積(discrete convolution)

3.2 積分線性變換

空域(spatial domain)頻域(frequency domain)(頻譜)

3.2.3 1D傅立葉變換

測不準原理(uncertainty principle):不可能存在時域和頻域都可以任意窄的訊號。

                                                                    “訊號持續時間” \bullet

 “頻寬” \geqslant \frac{1}{\pi }

3.2.4 2D傅立葉變換

空間頻率(spatial frequencies)

3.2.5 取樣與夏農約束

取樣間隔(sampling interval)

在某些情況下,週期性重複的影象傅立葉變換F(u,v)會引起影象失真,這種現象被稱為混迭(aliasing)

因此取樣需滿足夏農取樣定理(Shannon sampling theorem):

                                                                     \Lambda x< 1/2U, \Delta y<1/2V

即:設已知影象中感興趣的最小細節的尺寸,取樣間隔應該比它的一半還要小。在實際的影象數字轉換器中,取樣間隔比夏農取樣定理所確定的值的1/10還要小。原因在於將數字化影象函式在顯示器上重構為連續影象的演算法僅使用的是階躍函式,即線條是由表達為方塊的畫素形成的。

3.2.6 離散餘弦變換

離散餘弦變換(DCT)是積分線性變換,與離散傅立葉變換(DFT)相似。

在影象處理中,主要是在影象壓縮中,使用最多的離散餘弦變換是DCT-II。

3.2.7 小波變換

在資料壓縮、特徵提取和影象噪聲抑制中,小波的應用得到了巨大的成功——可以將對應於噪聲的“小的”小波分量的影響消除到幾乎為零的程度,而並不減弱影象中重要的小細節。

3.2.8 本徵分析

正交基向量(orthogonal basis vector),這些基向量稱作本徵向量(eigen-vector),本徵向量的固有正交性確保了相互獨立性。

3.2.9 奇異值分解

3.2.10 主分量分析(PCA)

在統計學中,PCA是一種將高維資料集簡化到低維以便於分析或顯示的方法。它是一種線性變換,將資料在新的座標系下表達出來,其基向量採用資料中具有最大發散度的模態:它是將觀測空間分解為具有最大方差的正交子空間的最優線性變換方法。與FFT相比,PCA靈活性的一個代價是更高的計算需求。

由於產生降維,PCA可用於有損的資料壓縮(lossy data compression),以保留資料集對其方差影響最大的那些特徵。PCA將一組可能相關的變數變換為同樣數量的不相關的變數,稱為主分量(principal component)。第一個主分量儘可能大地反映資料中的發散性,每個後續分量儘可能地反映剩餘的發散性。

3.2.11 Radon變換

一個完備的(連續的)投影集合包含了與原影象相同的資訊,它被稱為Radon變換。與X射線斷層造影術影象有關。

3.3 作為隨機過程的影象

二階概率分佈函式(second-order distribution function)用於表達事件對間的關係。更簡單地用來刻畫隨機過程的是一階分佈函式(first-order distribution function),獨立於其他畫素來表達單個畫素灰度值的概率特性。

3.4 影象形成物理

景深(depth of focus,DOF)是指在攝影機鏡頭或其他成像器前沿能夠取得清晰影象的成像所測定的被攝物體前後距離範圍。而光圈、鏡頭、及拍攝物的距離是影響景深的重要因素。在聚焦完成後,焦點前後的範圍內所呈現的清晰影象,這一前一後的距離範圍,便叫做景深。在鏡頭前方(調焦點的前、後)有一段一定長度的空間,當被攝物體位於這段空間內時,其在底片上的成像恰位於焦點前後這兩個彌散圓之間。被攝體所在的這段空間的長度,就叫景深。換言之,在這段空間內的被攝體,其呈現在底片面的影象模糊度,都在容許彌散圓的限定範圍內,這段空間的長度就是景深。

場深(焦區長度)(depth of field)是指通過光學鏡頭形成清晰影象的景物的空間縱深範圍。景物各部分距離鏡頭有遠有近,所以在膠片上的聚焦點也分前後。攝影(像)鏡頭只能將某一特定距離上的平面物在像平面上形成清晰的像,但由於人眼解析度的侷限,在景物前後會有一個影像清晰的空間範圍。能夠形成清晰像的最遠物與對焦瞄準物之間的距離為後景深,能夠形成清晰像的最近物與對焦瞄準物之間的距離為前景深,前、後景深之和為全景深。

3.4.3 鏡頭像差和徑向畸變

鏡頭幾何畸變的實際模型包含兩個畸變成分。第一個是徑向畸變(radial distortion),由鏡頭對光線的折射或多或少地偏離理想情況所引起。第二個是相對於影象中點的主點移位(shift of the principle point)。