筆記：影象分割演算法之 Graph Cut

阿新 • • 發佈：2019-01-17

Graph Cut 與Grab Cut 都是基於圖論得分割方法。另外OpenCV實現了Grab Cut。Graph cuts 是一種有用和流行的能量優化演算法，在計算機視覺領域應用於前背景分割，立體視覺，摳圖。此類問題與圖的最小割問題相關聯。
首先用一個無向圖 G 表示要分割的影象，V和E分別是頂點（vertex）和邊（edge）的集合。此處的Graph和普通的Graph稍有不同。Graph Cuts 圖在普通圖的基礎上多了兩個頂點，這兩個頂點分別用符號“S”與“T”表示，統稱為終端頂點。其他所有的頂點都必須和這兩個頂點相連形成邊集合中的一部分。所以Graph Cuts中有兩個頂點，也有兩種邊。
第一種頂點和邊：普通頂點對應於影象中的每個畫素。每兩個鄰域頂點（對應於影象中每兩個鄰域畫素）的連線就是一條邊。這種邊也叫n-links。第二種頂點和邊是：除影象畫素外，還有另外兩個終端頂點，叫S（source：源點，取源頭之意）和T（sink：匯點，取聚合之意）。每個普通頂點和這兩個終端頂點之間都有連線，組成第二種邊。這種邊也叫t-links。
這裡寫圖片描述

上圖就是一個影象對應的s-t圖，每個畫素對應圖中的一個相應定點，另外還有s和t兩個頂點。上圖有兩種邊，實線表示每個鄰域普通頂點連線的邊n-links，虛線表示每個普通頂點與s和t連線的邊t-links。在前後景分割中，s一般表示前景目標，t一般表示背景。
圖中每條邊都有一個非負權值We，也可理解為cost（代價或者費用）。一個cut（割）就是圖中邊集合E的一個子集C，那這個割的cost（表示為|C|）就是邊子集C的所有邊的權值的總和。
Graph Cuts 中的Cuts是指這樣的一個邊集合，顯然這些邊集合包括了上邊2種邊，該集合中所有邊的斷開會導致殘留“S”和“T”圖的分開，所以就成為割。
當一個割使得它的邊所有權值之和最小，那麼就成為最小割，也就是圖割的結果。福特.富克森定理表明，網路的最大流max flow與最小割min cut相等。所以由Boykov和Komogorov發明的max-flow/min-cut演算法就可以用來獲得s-t圖的最小割。這個最小割把影象的前景畫素集和背景畫素集，那就相當於完成了影象分割。
也就是圖中邊的權值就決定了最後的分割結果，那麼這些邊的權值怎麼確定呢？影象分割可以看成pixel labeling（畫素標記）問題，目標（s-node）的label設為1，背景（t-node）的label設為0，這個過程可以通過最小化圖割來最小化能量函式得到。那很明顯，發生在目標和北京的邊界處的cut就是我們想要的（相當於把影象中背景和目標連線的地方割開，那就相當於把其分割了）。同時，這時候能量也應該是最小的，假設整幅影象的標籤label（每個畫素的label）為L={l1,l2,l3..lp}其中l1i為0（背景）或者1（目標）那假設影象的分割為L時，影象的能量可以表示為： E(L)=aR(L)+B(L) 其中，R(L)為區域項，B(L)為邊界項，而a就是區域項和邊界項之間的重要因子，決定他們對能量的影響大小。如果a=0，則只考慮邊界因素不考慮區域因素。E(L)表示的是權值，即損失函式，也叫能量函式，圖割的目標就是優化能量函式使其值達到最小。
區域項：
這裡寫圖片描述

其中Rp(lp)表示為畫素p分配標籤lp的懲罰，Rp(lp)能量項的權值可以通過比較畫素p的灰度和給定的目標和前景的灰度直方圖來獲得，換句話說就是畫素p屬於標籤lp的概率，我希望畫素p分配為其概率最大的標籤lp，這時候我們希望能量最小，所以一般取概率的負對數值，故t-link的權值如下：
Rp(1) = -ln Pr(Ip|’obj’)；
Rp(0) = -ln Pr(Ip|’bkg’)
由上面兩個公式可以看到，當畫素p的灰度值屬於目標的概率Pr(Ip|’obj’)大於背景Pr(Ip|’bkg’)，那麼Rp(1)就小於Rp(0)，也就是說當畫素p更有可能屬於目標時，將p歸類為目標就會使能量R(L)小。那麼，如果全部的畫素都被正確劃分為目標或者背景，那麼這時候能量就是最小的。
這裡寫圖片描述

其中，p和q為鄰域畫素，邊界平滑項主要體現分割L的邊界屬性，B可以解析為畫素p和q之間不連續的懲罰，一般來說如果p和q越相似（例如它們的灰度），那麼B越大，如果他們非常不同，那麼B就接近於0。換句話說，如果兩鄰域畫素差別很小，那麼它屬於同一個目標或者同一背景的可能性就很大，如果他們的差別很大，那說明這兩個畫素很有可能處於目標和背景的邊緣部分，則被分割開的可能性比較大，所以當兩鄰域畫素差別越大，B越小，即能量越小。好了，現在我們來總結一下：我們目標是將一幅影象分為目標和背景兩個不相交的部分，我們運用圖分割技術來實現。首先，圖由頂點和邊來組成，邊有權值。那我們需要構建一個圖，這個圖有兩類頂點，兩類邊和兩類權值。
普通頂點由影象每個畫素組成，然後每兩個鄰域畫素之間存在一條邊，它的權值由上面說的“邊界平滑能量項”來決定。還有兩個終端頂點s（目標）和t（背景），每個普通頂點和s都存在連線，也就是邊，邊的權值由“區域能量項”Rp(1)來決定，每個普通頂點和t連線的邊的權值由“區域能量項”Rp(0)來決定。這樣所有邊的權值就可以確定了，也就是圖就確定了。這時候，就可以通過min cut演算法來找到最小的割，這個min cut就是權值和最小的邊的集合，這些邊的斷開恰好可以使目標和背景被分割開，也就是min cut對應於能量的最小化。而min cut和圖的max flow是等效的，故可以通過max flow演算法來找到s-t圖的min cut。
目前的演算法主要有：
1)Goldberg-Tarjan
2)Ford-Fulkerson
3)上訴兩種方法的改進演算法
這裡寫圖片描述

筆記：影象分割演算法之 Graph Cut

筆記：影象分割演算法之 Graph Cut

數字影象處理筆記（十二）：影象分割演算法

OpenCv學習筆記4--影象分割之GrabCut演算法

opencv學習筆記五十六：分水嶺分割演算法

opencv學習筆記六十五：人臉識別演算法之EigenFace

影象演算法之七：特徵提取演算法之LBP

OPENCV的學習：影象特徵檢測之Harris角點演算法

影象演算法之六：特徵提取演算法之LoG

影象分割演算法：基於梯度分水嶺的分割演算法

grabcut in one-cut 一種好用快速的影象分割演算法

基於圖的影象分割方法（Graph-Based Image Segmentation）原始碼閱讀筆記

南開大學提出最新邊緣檢測與影象分割演算法，精度重新整理記錄（附開源地址）

計算機視覺（八）：影象分割

影象分割演算法

CS231n課程筆記：影象分類筆記（下）

區塊鏈核心技術：拜占庭共識演算法之PBFT全面理解

論文筆記：目標檢測演算法（R-CNN，Fast R-CNN，Faster R-CNN，YOLOv1-v3）

Python3《機器學習實戰》筆記：K-近鄰演算法

ONE筆記：DirectDlivery路由演算法（ONE模擬執行機制解析）

影象處理演算法之美顏

筆記：影象分割演算法之 Graph Cut

相關推薦