1. 程式人生 > >數字影象處理(一)概論與基本原理

數字影象處理(一)概論與基本原理

概論

數字影象處理是指將影象訊號轉換成數字訊號並利用計算機對其進行處理的過程。而人眼觀察外界世界是先通過人眼將看到的內容傳入大腦來進行處理。二者雖然看上去不同,但其實際過程十分相似。人的眼球可以比作一架活的照相機。照相機有鏡頭、光圈、暗箱、底片和調節裝置。人眼的結構和照相機十分相似,角膜和晶狀體相當於鏡頭,瞳孔相當於光圈,脈絡膜相當於暗箱,視網膜相當於底片。自然界各種物體在光線的照射下,不同顏色可以反射出明暗不同的光線,這些光線透過角膜、晶狀體、玻璃體的折射,在視網膜上成像,構成光刺激。視網膜上的感光細胞(圓錐和桿狀細胞)受光的刺激後,經過一系列的物理化學變化,轉換成神經衝動,由視神經傳入大腦皮質的視覺中樞,然後我們就能看見物體了。從整個處理過程可以分為以下三個層次來比較分析:

一.初級處理:

對於數字影象處理而言,在影象獲得的過程中,低階處理包括影象獲得的原始過程和操作,如降低噪聲的影象預處理、對比度增強和影象銳化等。對於人來說,人眼通過對角膜、瞳孔等的調節來調節來適應實際環境以獲得最佳的視覺效果,比如在看遠近與亮暗環境下的自動調節。

二.中級處理

數字影象處理的中級處理例如影象分割,將影象分為區域或者目標,然後對這些目標進行描述,以便把他們簡化為適合計算機處理的形式,並對單個目標進行分類(識別)。實際上這一過程計算機從輸入的影象中提取相關的屬性,例如邊緣、輪廓和單個物體的特性。人在獲得一副影象的資訊時這一過程並不是十分明顯,而是直接驚醒了高階處理,通過聯想(例如人的神經網路)來將物體區分開來。但實際過程是人先從這個畫面中把相關的物體先區分出來這一中級處理,而後再做的高階處理。

三.高階處理

最後,計算機視覺高階處理通過以執行通常與人類視覺相關的感知函式,來對識別的物件進行總體確認。在這一領域中,其最終的目的是用計算機模仿人類視覺,包括學習和推理,並根據視覺輸入採取操作。這個領域屬於人工智慧(AI)的分支,最終目標為實現像人一樣來,對於視覺資訊進行推理與分析。


基本原理

  • 影象

某種物理量的空間分佈,這裡指的是光強(光通量)在影象平面 f(x, y)的分佈。即一副影象可以定義為一個二維函式,其中x,y為影象空間座標,而 f 在任意座標(x, y)處的幅度稱為影象在該點的亮度或灰度。

  • 數字

這裡的數字包含了兩層的含義:其一,將實際空間中連續的影象資訊離散化,即 x, y, f(x, y)的值都是有限的離散的影象稱之為數字影象。其二,該獲得與處理過程是通過計算機,並結合數學方法來實現的。

  • 處理

 影象的運算 | 影象的濾波 | 影象的編碼與壓縮 | 影象分割 | 影象特徵提取 | ...

數字影象的取樣與量化

影象數字化的基本過程是一個AD轉換的過程,在把一個模擬量轉化為數字量時,包含有以下幾個過程:取樣、編碼和量化。

取樣定理

訊號,頻率與頻譜 | 傅立葉級數 | 空間頻率 | 奈奎斯特取樣定理 | 夏農定理

夏農公式:適用於限頻、限功率高斯通道

奈奎斯特公式:適用於無碼間干擾的理想低通訊道

夏農公式:C=B×log2(1+S/N)。式中:B是通道頻寬(Hz),S是訊號功率(瓦),N是噪聲功率(瓦)。夏農公式描述了限頻、限功率高斯通道的最大資訊傳輸速率(bps)與通道頻寬、信噪比之間的關係。夏農公式給出了資訊傳輸速率的極限,即對於一定的傳輸頻寬和一定的信噪比,資訊傳輸速率的上限就確定了。這個極限是不能夠突破的。要想提高資訊的傳輸速率,必須設法提高傳輸線路的頻寬,或者必須設法提高信噪比。

奈奎斯特公式:C = 2B×log2 (M) ,式中:C 是資訊傳輸速率(bps),B是頻寬(Hz),M是訊號編碼級數。碼元傳輸的速率(又叫波特率,單位Baud)是受限的,最高碼元傳輸速率=2B(Baud)。但奈奎斯特公式並沒有對資訊傳輸速率(bps)給出限制。要提高資訊傳輸速率就必須使每一個傳輸的碼元能夠代表更多個位元的資訊。這就需要有很好的編碼技術。

數字影象的性質

解析度(空間取樣解析度) | 量化級數(灰度解析度) | 空間頻率分佈 | 噪聲水平

數字影象硬體組成

光源 | 光學系統 | 探測器 | 計算機(DSP) | 介面(採集卡)