1. 程式人生 > >《影象處理、分析與機器視覺》(第4版)閱讀筆記——第五章 影象預處理

《影象處理、分析與機器視覺》(第4版)閱讀筆記——第五章 影象預處理

預處理不會增加影象的資訊量,一般會降低熵。因此,從資訊理論的角度看,最好的預處理是沒有預處理:避免(消除)預處理的最好途徑是著力於高質量的影象獲取。實際影象中的屬於一個物體的相鄰畫素通常具有相同的或類似的亮度值,因此如果一個失真了的畫素可以從影象中被挑出來,它也許就可以用其鄰接畫素的平均值來複原。

5.1 畫素亮度變換

有兩類畫素亮度變換:亮度校正(brightness corrections)灰度級變換(gray-scale transformation)。亮度校正在修改畫素的亮度時要考慮該畫素原來的亮度和其在影象中的位置。灰度級變換在修改畫素的亮度時無須考慮其在影象中的位置。

5.1.1 位置相關的亮度校正

只有當影象退化過程是穩定的才能使用。實際中不存在。

5.1.2  灰度級變換

直方圖均衡化(histogram equalization)增強了靠近直方圖極大值附近的亮度對比度,減少了極小值附近的對比度。

缺點: 
  1)變換後圖像的灰度級減少,某些細節消失; 
  2)某些影象,如直方圖有高峰,經處理後對比度不自然的過分增強。

這種方法通常用來增加許多影象的區域性對比度,尤其是當影象的有用資料的對比度相當接近的時候。通過這種方法,亮度可以更好地在直方圖上分佈。這樣就可以用於增強區域性的對比度而不影響整體的對比度,直方圖均衡化通過有效地擴充套件常用的亮度來實現這種功能。
  這種方法對於背景和前景都太亮或者太暗的影象非常有用,這種方法尤其是可以帶來X光影象中更好的骨骼結構顯示以及曝光過度或者曝光不足照片中更好的細節。這種方法的一個主要優勢是它是一個相當直觀的技術並且是可逆操作,如果已知均衡化函式,那麼就可以恢復原始的直方圖,並且計算量也不大。這種方法的一個缺點是它對處理的資料不加選擇,它可能會增加背景雜訊的對比度並且降低有用訊號的對比度。(

【數字影象處理】直方圖均衡化詳解及程式設計實現

理論基礎參考:直方圖均衡化的數學原理

5.2 幾何變換

幾何變換可以消除影象獲取時所出現的幾何變形,由兩個基本步驟組成,第一步是畫素座標變換(pixel co-ordinate transformation),將輸入影象畫素對映到輸出影象。輸出點的座標將會是連續數值(實數),這是因為在變換後其位置不大可能對應於數字柵格。第二步找到與變換後的點匹配最佳的數字光柵中的點,並確定其亮度數值。該數值通常是用領域中的幾個點的亮度插值(interpolation)計算的。

5.2.1 畫素座標變換

雙線性變換(bilinear transform),需要至少4對對應點來解出變換系數:

                                                                     x'=a_{0}+a_{1}x+a_{2}y+a_{3}xy

                                                                     y'=b_{0}+b_{1}x+b_{2}y+b_{3}xy

仿射變換(affine transformation),比雙線性變換更簡單,需要需要3對對應點來解出變換系數:

                                                                     x'=a_{0}+a_{1}x+a_{2}y

                                                                     y'=b_{0}+b_{1}x+b_{2}y

雅可比行列式(Jacobian determinant)J提供了座標系如何變化的資訊。

幾個重要的幾何變換是:

  • 旋轉(rotation)
  • 變尺度(change of scale)
  • 歪斜(斜切)(skewing)

5.2.2 亮度插值

三種常用的插值方法:最近鄰、線性、雙三次(bi-cubic)。

最近鄰插值(nearest-neighborhood interpolation):定位誤差最大是半個畫素。這種誤差在物體具有直線邊界時就會顯現出來,在變換後可能會呈現階梯狀。

線性插值(linear interpolation):可能會引起小的解析度降低和模糊,原因在於其平均化的本性,但是減輕了階梯狀直邊界的問題。

雙三次插值(bi-cubic interpolation):免除了最近鄰插值的階梯狀邊界問題,也解決了線性插值的模糊問題。

5.3 區域性預處理

平滑(smoothing)目的在於抑制噪聲或其他小的波動,這等同於在傅立葉變換或抑制高頻部分。缺點:也會模糊所有的含有影象重要資訊的明顯邊緣。

梯度運算元(gradient operators)目的在於在影象中顯現影象函式快速變化的位置。

5.3.1 影象平滑

在限制資料有效性下的平均(averaging with limited data validaity)

根據反梯度平均(averaging according to inverse gradient)

使用旋轉掩膜的平均(averaging using a rotating mask)

中值濾波(median filtering):是一種減少邊緣模糊的非線性平滑方法,思想是用領域中亮度的中指代替影象當前的點。鄰域中的中值不受個別噪聲毛刺的影響,因此可以很好地消除衝擊噪聲。

非線性均值濾波(non-linear mean filter)

5.3.2 邊緣檢測運算元(edge detectors)

描述邊緣的檢測子使用偏導數。影象函式的變化可以用指向影象函式最大增長方向的梯度來表示。

Roberts運算元:使用當前畫素的2x2鄰域,主要缺點是對噪聲的高度敏感性,原因是僅使用了很少幾個畫素來近似梯度。

Laplace運算元:缺點是它對影象中的某些邊緣產生雙重響應。

Prewitt運算元

Sobel運算元:水平和垂直邊緣的檢測。

Kirsch運算元

5.3.3 二階導數過零點

Laplacian of Gaussian(LoG)

difference of Gaussians(DoG)

5.3.4 影象處理中的尺度

尺寸空間濾波(scale-space filtering)

尺度空間影象(scale-space image)

5.3.5 Canny邊緣提取

對受白噪聲影響的階躍型邊緣是最優的。Canny檢測子的最優性與以下的三個標準有關:

  • 檢測標準:不丟失重要的邊緣,不應有虛假的邊緣。
  • 定位標準:實際邊緣與檢測到的邊緣位置之間的偏差最小。
  • 單響應標準:將多個響應降低為單個邊緣響應。

5.3.6 引數化邊緣模型

5.3.7 多光譜影象中的邊緣

5.3.8 頻域的區域性預處理

最常見的影象增強問題包括噪聲抑制、邊緣增強和去噪,這些都能在頻域內完成。

對於頻率濾波,有幾種濾波器很有用:其中兩個重要代表是高斯濾波器巴特沃斯濾波器

另一種作用於頻域的有用的預處理技術是同態濾波(homomorphic filtering),用於去除相乘性的噪聲。增加對比度,同時在整幅影象內規範化影象亮度。減弱係數為0.5的巴特沃斯濾波器,可以保留適當的低頻,使影象體現出更多細節。

5.3.9 用區域性預處理運算元作線檢測

線尋找操作(Line finding operators)的目標是,尋找影象中的很細的線;它的假設是,曲線沒有劇烈彎曲。常用卷積核如下:

h_{1}=\begin{bmatrix} -1&-1 &-1 \\ 2 &2 &2 \\ -1 &-1 &-1 \end{bmatrix}      h_{2}=\begin{bmatrix} 2 &-1 &-1\\ -1 & 2 &-1 \\ -1 & -1 & 2 \end{bmatrix}   h_{3}=\begin{bmatrix} -1 &2 &-1 \\ -1& 2 &-1 \\ -1&2 & -1 \end{bmatrix}   ……....................................................

類似的原則還能應用於更大的模板,通常5x5大小的模版最常用。

5.3.10 角點(興趣點)檢測

Moravec檢測器(Moravec detector)是最簡單的角點檢測器

Harris角點檢測器(Harris corner detector)對二維平移和旋轉、少量光照變化、少量視角變化都不敏感,而且其計算量很小。另一方面,當有較大變化、視角變化以及對比鮮明的劇烈變化時,它就失去了原先的不變性。

5.3.11 最大穩定極值區域檢測

如果影象被縮放或經過射影變換,則Harris檢測器的輸出也會劇烈改變。

最大穩定極值區域(Maximally Stable Extremal Regions, MSER)是一種影象結構,不僅是在平移和旋轉後,即便經歷相似和仿射變換,它仍可被重複檢測出來。

5.4 影象復原

在抑制退化而利用有關退化性質知識的預處理方法為影象復原(image restoration)

維納濾波