1 - 引言

在影象識別中，如果可以將影象感興趣的物體或區別分割出來，無疑可以增加我們影象識別的準確率，傳統的數字影象處理中的分割方法多數基於灰度值的兩個基本性質

不連續性
以灰度突變為基礎分割一副影象，比如影象的邊緣
相似性
根據一組預定義的準則將一副影象分割為相似的區域。閾值處理、區域生長、區域分裂和區域聚合都是這類方法的例子。
在邊緣檢測演算法中我們學習瞭如何利用不連續性來分割影象。
本文將從相似性這個角度，學習使用閾值處理、基於區域、和基於形態學的分水嶺分割影象

2 - 閾值處理

由於閾值處理直觀、實現簡單且計算速度快，因此影象閾值處理在影象分割應用中處於核心地位

2.1 - 基礎知識

下圖灰度直方圖對應影象f(x,y)，然後f(x,y)>T的任何點(x,y)稱為一個物件點；否則將該點稱為背景點。分割後的影象g(x,y):
$g (x, y)$

= { 1 f (

x , y ) > T 0 f ( x , y ) ≤ T g(x,y)=\begin{cases} 1 & f(x,y)>T \\ 0& f(x,y)\leq T \end{cases}

g (x, y) = {10 f (x, y) > T f (x, y) \leq T

當T時一個適用於整個影象的常數時，該公式給出的處理稱為全域性閾值處理。

在這裡插入圖片描述

但是要求兩個以上閾值的分割問題很難解決（通常是不可能的），而較好的結果通常可以用其他方法得到。

我們可以很自然的得出灰度閾值的成功與否直接關係到可區分的直方圖模式的谷的寬度和深度，而影響波谷特性的關鍵因素是：

波峰間的間隔（波峰離的越遠，分離這些模式的機會越好）
影象中的噪聲內容（模式隨噪聲的增加而展寬）
物體和背景的相對尺寸
光源的均勻性
影象反射特性的均勻性

2.2 - 基本的全域性閾值處理

在大多數應用中，通常影象之間有較大的變化，即使全域性閾是一種合適的方法，對每一幅影象有能力自動估計閾值的演算法也是需要的。下面的迭代演算法可以用於這一目的：

為全域性閾值T選擇一個初始估計值
利用T分割影象。這將產生兩組畫素： $G_1$ 由灰度值大於T的所有畫素組成， $G_2$ 由所有小於等於T的畫素組成。
對 $G_1$ 和 $G_2$ 的畫素分別計算平均灰度值（均值） $m_1$ 和 $m_2$
計算一個新的閾值： $T = \frac{1}{2}(m_1+m_2)$
重複步驟2到步驟4，直到連續迭代中的T值間的差小於一個預定義的引數 $\Delta T$ 為止

2.3 - 用Otsu方法的最佳全域性閾值處理

閾值處理可視為一種統計決策理論問題，其目的是在把畫素分配給兩個或多組（也稱分類）的過程中引入的平均誤差最小。Otsu方法（Otsu[1979]）是另一種有吸引力的方案。

Otsu方法有一個重要的特性，即它完全以在一幅影象的直方圖上執行計算為基礎。

一幅影象有MxN個畫素，L個不同的灰度級， $n_i$ 表示灰度級為i的畫素個數。那麼影象中畫素總數MN為 $MN=n_0+n_1+\dots+n_{L-1}$

歸一化的直方圖 $p_i=n_i/MN$ ，由此有
$\sum_{i=0}^{L-1}p_i=1, p_i \geq 0$

現在，我們假設選擇一個閾值 $T(k)=k, 0< k < L-1$ ，並使用它把輸入影象閾值化處理為兩類 $C_1$ 和 $C_2$ ，其中， $C_1$ 由影象中灰度值在範圍[0,k]內的所有畫素組成， $C_2$ 由灰度值在範圍[k+1,L-1]內的所有畫素組成。用該閾值，畫素被分到類 $C_1$ 中的概率 $P_1(k)$ 由如下的積累和給出：
$P_1(k)=\sum_{i=0}^k p_i$

因此分配到 $C_1$ 的畫素的平均灰度值為：
$m_1(k)=\sum_{i=0}^kiP(i/C_1)$
$=\sum_{i=0}^kiP(C_1/i)P(i)/P(C_1)$
$=\frac{1}{P_1(k)}\sum_{i=0}^kiP(i)$

第二行來自貝葉斯公式：
$P(A/B)=P(B/A)P(A)/P(B)$

類似的我們也可以得到 $C_2$ 的畫素平均灰度值

然後我們可以得到整個影象的平均灰度值

數字影象處理筆記（十二）：影象分割演算法

1 - 引言

2 - 閾值處理

2.1 - 基礎知識

2.2 - 基本的全域性閾值處理

2.3 - 用Otsu方法的最佳全域性閾值處理

數字影象處理筆記（十二）：影象分割演算法

數字影象處理筆記（十一）：邊緣檢測演算法

機器學習筆記（十二）：TensorFlow實戰四（影象識別與卷積神經網路）

機器學習筆記（十二）：TensorFlow實現四（影象識別與卷積神經網路）

Python+Selenium筆記（十二）：數據驅動測試

Python3學習筆記（十二）：閉包

javaweb學習筆記（十二）：JSP（2）

學習筆記（十二）：推薦系統-隱語義模型

Cris 的Python筆記（十二）：面向物件其他細節語法

Python學習筆記（十二）：lambda表示式與函數語言程式設計

機器學習筆記（十二）：聚類

Python3《機器學習實戰》學習筆記（十二）：線性迴歸提高篇之樂高玩具套件二手價預測

各種音視訊編解碼學習詳解之編解碼學習筆記（十二）：其他編解碼（M-JPEG，Motion JPEG 2000，DivX）

cortex_m3_stm32嵌入式學習筆記（十二）：TFTLCD顯示（深入庫函式）

Unity Shader入門精要筆記（十二）：紋理屬性

pytorch學習筆記（十二）：詳解 Module 類

Docker學習筆記（十二）：Docker Swarm

計算機圖形學學習筆記（十二）：顏色模型，簡單 / 增量光照模型

OpenCV2學習筆記（十九）：Kalman濾波演算法

數字影象處理筆記（十）：形態學影象處理

數字影象處理筆記（十二）：影象分割演算法

1 - 引言

2 - 閾值處理

2.1 - 基礎知識

2.2 - 基本的全域性閾值處理

2.3 - 用Otsu方法的最佳全域性閾值處理

相關推薦