1. 程式人生 > >[計算機視覺]數字影象以及影象處理的基本步驟

[計算機視覺]數字影象以及影象處理的基本步驟

       眾所周知,數字影象又稱為數碼影象,是二維影象用有限數字值畫素的表示。其中,畫素是數字影象的基本單元。而一幅模擬影象如果想要變成一幅數字影象,就需要經過數字化才能得到,數字化包括兩個過程:取樣量化

       取樣是把空間上的連續的影象分割成離散的畫素的集合,取樣的間隔越小,影象的精細度就越大;取樣的間隔越大,精細度就越小。

                                   注意:取樣的間隔必須滿足二維取樣定理(Nyquist準則)

                                              即:取樣的間隔必須<2(1/影象函式上限頻率)

比如,我們以著名的lena圖為例,使影象的取樣間隔不斷擴大,可以得出下列一組影象

由圖可知,取樣的精度對於影象的影響很明顯,當間隔越來越大時,幾乎已經看不到細節了。

       量化是把畫素的灰度(濃淡)變換成離散的整數值的操作。量化地越細緻,也就是位元數越大,灰度解析度就越高,灰度級數表現地就越豐富。

       在這裡還是以著名的lena圖作為例子,在下圖中,將以8位元、6位元、4位元以及3位元和1位元作為展示。

          可見,量化位元數越大,影象的質量越好,其中,8位元以為這畫素的灰度(濃淡)是0~255之間的數值,而當位元數減少到1位元(2級)時,就成為二值影象,可用0代表黑和1代表白。

                                        取樣

量化的結果是一個實數的矩陣

  其中—>                                         取樣:座標的數字化

  其中—>                                         量化:幅值的數字化

 

       綜上所述,一幅影象所對應的座標以及幅值可能是無限和連續的,當需要把一幅影象數字化時,其實際上是把一幅影象 I=(x,y)所對應的座標(x,y)和幅值 I 都變化成有限和離散的量。

 

一幅影象可以看做無數個很小的光點強度的集合,當用數學方法來描述一幅影象時,首先表現為光點的強度,即一幅影象可看成空間各座標點上光點強度 I 的集合,其表示式為

對於一幅三維彩色的動態影象來說,(x,y,z)為空間座標,為波長,T 為時間。

而對於一幅二維灰度的靜態影象來說,空間座標只有(x,y),為常數,因為是靜態所以也與T無關。

我們經常使用的是二維灰度的靜態影象進行影象處理,所以MxN數字影象函式可表示如下:

                  等式的右邊是所定義的矩陣形式的影象,矩陣的每個元素被稱為畫素

                        所以:畫素值是一個經過函式 f(x,y)處理之後得出的結果。

       根據抽象程度和研究方法的不同,可以把數字影象處理分為影象處理影象分析影象理解三個層次

       A:底層—>影象處理,主要是對畫素級進行處理,強調影象變換以及影象之間的相互轉換,主要是指對影象進行各種變換以改善其視覺效果,為後續的影象分析和理解奠定基礎。它主要包括影象採集和獲取、影象增強或者消除噪聲的影象平滑等。

       B:中層—>影象分析,主要是對影象中感興趣區域進行檢測、實現特徵提取,然後用更加簡潔的資料形式描述影象。它包括影象分割、邊緣檢測、形態學影象處理、特徵選擇等。

       C:高層—>影象理解,主要是對描述影象的資料進行運算(影象處理演算法),進一步研究影象中各目標的性質及其關係,得到可觀的解釋,其處理過程和方法與人類的思維推理有類似之處。它包括影象識別、神經網路、遺傳演算法等。