1. 程式人生 > >影象處理:顯著性區域檢測總結(一)

影象處理:顯著性區域檢測總結(一)

1.Mingming Cheng,Global Contrast based Salient Region Detection,CVPR2011

1) HC:基於直方圖對比度的方法,每一個畫素的顯著性值是由它與影象中所有其他畫素的顏色差異來確定,得到全解析度顯著性影象;

2) RC:基於區域性對比度的方法,先將影象分割成小區域,採用的分割方法是基於圖的分割,基本分割思想是將每個畫素點作為無向圖的頂點,兩個畫素點之間的不相似度作為邊的權重,要求連線相同區域內的兩個頂點的邊的最大權重要小於連線不同區域的頂點的邊的最小權重,在迭代過程中進行頂點歸納與區域合併,具體參見論文Efcient graph-based image segmentation

;每個區域的顯著性值由它與其他所有區域的空間距離和區域畫素數加權的顏色差異來確定;空間距離為兩個區域重心的歐氏距離,較遠區域分配較小權值;

3) 細節加速:

① 基於直方圖的加速:將每個顏色通道由256個顏色值量化到12個顏色值後,對輸入影象計算顏色直方圖,保留高頻顏色,覆蓋95%影象畫素,剩下顏色捨棄,用直方圖中距離最近的顏色代替;

② 顏色空間平滑:減小量化誤差,每個顏色的顯著性值被替換為相似顏色顯著性的加權平均;在RGB空間進行量化,用Lab空間度量距離;

4) 評價:基於HC的理論方法很簡單,根據全域性對比度計算顯著度,計算速度快,對於背景較簡單的影象效果也不錯;RC改變了處理單元,由單個畫素到影象塊,速度較慢,效果並沒有比

HC提高很多,個人認為基於圖的分割結果不夠好,導致saliency map不均勻。

2.Yulin Xie,Visual Saliency Detection Based on Bayesian Model,ICIP2011

1) 基本流程:

① 檢測顯著目標的角點:顏色增強Harris角點檢測。對輸入的彩色影象計算顏色增強矩陣Mboost,用Mboost對輸入影象進行顏色轉換,計算顏色增強後的影象的Harris角點能量函式得到能量圖,選取能量圖中能量值最大的幾個點,並剔除影象邊界附近的點,得到較準確的顯著點;

② 用一個凸包將所有顯著點包圍起來,得到顯著區域的大致位置;

③ 將顯著度計算等價為貝葉斯後驗概率的計算:

 

a. 先驗概率p(sal):計算每個畫素顯著度。將輸入影象進行超畫素分割,計算每個超畫素的平均顏色和空間位置;對凸包內外的超畫素分別進行K-means聚類,計算凸包內每個cluster與凸包外所有clusters的平均顏色距離,最大距離對應的那個cluster為顯著cluster;其他所有超畫素的顯著度由它與顯著cluster內的超畫素的空間和顏色距離來確定;將計算的所有顯著值歸一化到[0,1],作為貝葉斯框架的先驗概率。

b. 觀測概率p(x|sal)p(x|bk):分別計算凸包內區域和凸包外區域的Lab顏色直方圖,對於任意畫素點x特徵值為Lab,分別找凸包內外直方圖相同Lab值對應的各通道bin,計算各通道bin包含畫素個數佔總畫素個數的百分比,三個百分比相乘。即框內外元素在框內和框外直方圖佔的比例。

④ 由貝葉斯公式計算最終的saliency map

2) 評價:對於簡單背景,效果也很好。Saliency map的準確度也很大部分取決於凸包的準確性,稍複雜背景會有很多的角點被檢測到,經常會有顯著範圍過大的情況,即false positive

3.Yun Zhai,Mubarak Shah,Visual Attention Detection in Video Sequences Using Spatiotemporal Cues,ACM2006

1) 系統框架:

 

① 時域顯著度模型

檢測連續視訊幀中的興趣點,用SIFT建立興趣點之間的對應,根據對應點計算單應性矩陣檢測運動平面,RANSAC演算法估計多個單應性矩陣來描述不同的運動模組;根據單應性矩陣得到投影點與實際點之間的投影誤差計算該畫素點的運動對比度,並加入單應性矩陣的跨越區域作為權重調節,避免紋理變化導致顯著點分佈不均勻的問題。

② 空域顯著度模型

計算畫素級的saliency map:該畫素點顏色與影象中所有其他畫素點的color distance map與其他畫素點顏色直方圖頻率的乘積;

計算區域級的saliency map:採用區域增長演算法,根據前面計算的顯著點對顯著區域進行初始化,以其為中心生成種子區域,通過計算區域邊緣的能量進行迭代擴張,最終得到一個矩形顯著區域。擴充套件的區域重疊時,採用區域合併技術;

③ 時域空域模型結合

動態結合,運動對比度較大時給時域顯著度模型賦予較大權重,否則給空域顯著度模型賦予較大權重。

2) 評價:基於視訊的顯著度檢測,考慮幀間運動顯著性資訊,和影象自身顯著性,值得進一步探索。速度較快,效果也比較穩定。

4.Xiaohui Shen,Ying Wu,A Unified Approach to Salient Object Detection via Low Rank Matrix Recovery,CVPR2012

1) 基本流程:文章提出了一種新的影象表示方法,將其表示為一個低秩矩陣(非顯著區域)加上稀疏噪音(顯著區域),再利用Robust PCA技術進行低秩矩陣恢復,得到的噪音就是顯著區域,再根據高層次的先驗知識來幫助修正顯著區域。

2) 影象矩陣:

① 提取特徵:RGBhuesaturation3尺度下4個方向共12steerable pyramids響應,3尺度8方向共12Gabor fileters響應,加起來一共53維。

② 矩陣構造:先利用Mean-shift演算法將影象分割成很多較小的segments再用每個segment中所有特徵向量的均值來表示這個segment,從而構造成為矩陣。

③ 特徵空間變換:保證特徵向量為低秩。

3) 高層先驗融合:位置先驗(基於影象中心高斯分佈),語義先驗(人臉檢測),顏色先驗(暖色更明顯)

4) 評價:對影象的表示比較新穎,但實驗效果一般,saliency map不均勻,提取特徵多,計算量大,低秩矩陣恢復速度也比較慢

6.Ali Borji,Boosting Bottom-up and Top-down Visual Features for Saliency Estimation,CVPR2012

1) 主要貢獻:

① 本文的主要出發點是一個貝葉斯公式的推導,在具有特徵f的某位置xsalient的概率p是等式的左邊,有如下:

此處假設fx相互獨立,且先驗概率p(s)相同,所以可以得到正相關最右。又有:

 

即與圖片中心點的歐式距離相關,所以本文主要研究的是特徵點和salient的對應關係。

② 將bottom-uptop-down聯合,底層特徵有方向,顏色,強度,顏色通道直方圖及概率,金字塔模型,現有的底層顯著圖例如GBVSTorralba模型,AWS模型;高層特徵包括水平線檢測,人車檢測,人臉檢測等。底層和高層加起來,每個pixel就對應一個34維的feature

③ 測試了多種分類器對於顯著圖計算的貢獻,採用online learning,先將feature matrix歸一化,使其平均數是0,標準差是1,然後建立一個等大小的label map,每個點取值+1/-1,人眼觀測的預測結果,top 20%標註+1bottom 40% 標註-1他將資料集分為N組,然後使用leave-one-out的方式進行訓練和測試。測試分類器有迴歸分類器(regression),線性核的SVMAdaBoost非線性分類器。實驗表明Adaboost效果最好。

④ 評估指標:AUC值為ROC曲線與x軸之間距離的積分;NSS歸一化掃描路徑的顯著性,描述saliency可以描述fixation的程度;線性相關係數CC表示saliency map和人眼關注map之間的線性關係,計算協方差。

2) 評價:論文內容上新意不大,底層特徵與高層知識的結合,倒是提供了不少特徵提取參考,以及各種分類器和評估準則的測試;沒有進行程式碼測試,覺得計算量應該很大。

7.Federico Perazzi,Philipp Krahenbuhl,Saliency Filters: Contrast Based Filtering for Salient Region Detection

1) 基本思想:顯著性一直以來都被認為應該是一個濾波器,該文作者想到了將其使用濾波器的方法進行加速。這篇文章主要是對區域性和全域性兩種顯著特徵的公式進行了分析,提出了一種可以再線性時間內計算的方法。

2) 方法流程:

① 影象分割:採用略微修改的超畫素分割,根據CIElab空間的測地線影象距離進行K-means聚類,產生大體上均勻尺寸,並且可以保持顏色邊界的超畫素分割。

② 顏色獨立性:

 

其中的權重與超畫素空間位置的距離有關,如果這個值給予長距離很低的權重,這個顏色獨立性就類似於中央周邊的對比度,即距離遠的畫素對其顯著性貢獻較低;如果這個權重為常數,這個顏色權重就類似於Mingming Cheng論文裡面的區域對比度。

這個公式也可以寫成:

 

第一項的Σ結果是1,第二和第三項都可以看做是以ω為核的濾波器,分別對cj cj2濾波。本文將這個核寫成了高斯的形式,並且藉助Adams提出的permutohedral lattice embedding 濾波器來實現線性時間的計算。

③ 空間顏色分佈:

權重是顏色的差距,前面是空間距離。根據ω(ci,cj)定義,顏色越接近近權重越大,即距離遠但顏色相近的畫素分佈值大,和前一個特徵剛好是相反,這個特徵可以表示某種顏色在空間分佈的廣度。例如某種顏色分散在影象中,但是面積都很小,那麼第一個特徵計算出來這個顏色的獨立性就比較高,但是第二個特徵會告訴你這個顏色的分佈很廣,並不顯著。

通過類似的推導,這個公式也可以寫成高斯濾波的形式,藉助Adams提出的permutohedral lattice embedding 濾波器來實現線性時間的計算,具體參考論文Fast High-Dimensional Filtering Using thePermutohedral Lattice

④ 顯著性融合:

 

由於空間顏色分佈的區分度更大,因此作者將其放在了指數的位置,並加了一個權重調節。Di越大即顏色分佈越廣,對應顯著性值越小;Ui越大對應顏色獨立性越高,對應顯著性值越大。

最後,特徵被從超畫素級對映到畫素級。每個畫素的顯著性是通過其所在超畫素以及周圍的超畫素進行高斯線性加權,權重取決於和顏色,位置的距離。最終的歸一化也很重要,要求顯著圖至少包含10%的顯著畫素,這種歸一化方式也會提升演算法最終的評價指標。

3) 論文評價:考慮到顏色自身獨立性與顏色分佈對顯著度的貢獻結合,演算法均在時域進行,並採用高斯濾波加速,得到很不錯的效果。實際測試結果saliency map較均勻,但公佈的程式碼缺少一些實驗細節,沒有論文的公佈結果好。

相關推薦

影象處理顯著區域檢測總結

1.Mingming Cheng,Global Contrast based Salient Region Detection,CVPR2011 1) HC:基於直方圖對比度的方法,每一個畫素的顯著性值是由它與影象中所有其他畫素的顏色差異來確定,得到全解析度顯著性影象; 2) RC:基於區域性對比度的方法,

HTML5技術之影象處理一個滑動的拼圖遊戲

HTML5技術之影象處理:一個滑動的拼圖遊戲 HTML5有許多功能特性可以把多媒體整合到網頁中。使用canvas元素可以在這個空白的畫板上填充線條,載入圖片檔案,甚至動畫效果。 在這篇文章中,我將做一個滑動拼圖的遊戲用來展示HTML5 canvas的圖片處理能力。 在網頁

影象處理工具包ImagXpress常見問題解答

ImagXpress是一組影象處理庫,可將影象處理新增到Windows應用程式中。此成像SDK通過藉助影象編輯,轉換,壓縮和顏色調整等功能,以及易於實現的程式碼和全面的程式碼示例可輕鬆新增影象處理和操作到Windows應用程式。ImagXpress的優點: 數十種影象處理功能 易於

Python影象處理庫PIL的Image模組介紹

Image模組是PIL中最重要的模組,它有一個類叫做image,與模組名稱相同。Image類有很多函式、方法及屬性,接下來將依次對image類的屬性、函式和方法進行介紹。 1、  Format 定

第78天jQuery事件總結

操作 現在 see 100萬 新的 cli 文檔 dom 擴展 jQuery事件總結(一)   現在就一點一點積累自己的知識體系,記錄自己學到的和自己所理解的jQuery。   JavaScript和HTML之間的交互式通過用戶和瀏覽器操作頁面時引發的事件機制來處理的

Mybatis總結mybatis的搭建

ack pen devel column 3.3 exception ive pri tac mybatis:它抽象了大量的jdbc代碼,並提供了一個簡單易用的API和數據庫交互。 mybatis的優勢:它消除了大量jdbc冗余的代碼、它可以接受SQL語句。 mybati

能測試入門能測試中的各項指標告訴我們什麽

並不是 速度 阿裏 機制 找到 客戶 測試過程 著名 HP 性能測試 性能測試是通過自動化的測試工具模擬多種正常、峰值以及異常負載條件來對系統的各項性能指標進行測試。 按照不同的目標,可以分為負載測試、壓力測試、容量測試、穩定性測試。平時工作中如果不是專業的測試機構,開

HBase能優化方法總結

rec inter next memstore 不支持 lena cred 追加 查詢效率 一 表的設計 1.1 Pre-Creating Regions 默認情況下,在創建HBase表的時候會自動創建一個region分區,當導入數據的時候,所有的HBase客戶端都向這

HLS圖像處理總結

特征提取 分析 參數 gets eight xilinx 意思 導入 vhdl HLS工具 以個人的理解,xilinx將HLS(高層次綜合)定位於更方便的將復雜算法轉化為硬件語言,通過添加某些配置條件HLS工具可以把可並行化的C/C++的代碼轉化為vhdl或verilog,

Gitgit-checkout的用法總結2

參考 正文 nsa dex block -o onf script 還需要 原帖收藏於IT老兵驛站,傳遞一個IT老兵在雕零前的光和氧。 前言 結合前一篇文章,再認真總結一下git-checkout的用法,因為可能一次總結到不了位,那麽就不怕啰嗦,不怕重復,多總結幾次,這樣可

shell問題總結if之組合判斷以及判斷文件是否存在

單引號 系列 空格 菜鳥 man 表達 遠程 www href shell問題總結,這一系列都是我作為菜鳥在工作過程中遇到問題解決的過程,希望記錄下來對新學者有幫助。 需求:要解決遠程服務器中一個文件是否存在 1、判斷一個文件是否存在一般形式是 if [ -f file

安卓介面基礎知識總結LinearLayout佈局的常見屬性

之前做專案都是用到了才會查詢自己所需的,沒有系統總結一下,也沒有特意去記,面試的時候被問到了居然不知道,-_-|| 決定開始系統總結一下: 1. android:orientation:設定線性佈局是水平還是豎直排列,可能選項如下: 1)vertical,豎直 2)horizontal,水

經典論文重讀---目標檢測RCNN

核心思想 Since we combine region proposals with CNNs, we call our method R-CNN: Regions with CNN features. 即將生成proposal的方法與cnn提取特徵進行結合

python網路爬蟲web spider系統化整理總結入門

接觸爬蟲很久了,一直沒有個系統的理解和整理,近來假日無事,總結一下。 -------------------------------------------以下是目錄--------------------------------------------------------- 一、爬蟲概

Oracle 技巧總結行轉列 及 列裝行

1.行轉列 oracle中行轉列 語法結構select listagg(column1, ',') within group(order by column2) from X;  如下圖所示: listagg(attr1, attr2):第一個引數是要行轉列的那個欄位

Spring體系總結BeanDefinition

1、BeanDefinition簡介 BeanDefiniton是一個介面,繼承自AttributeAccessor和BeanMetadataElement兩個介面,這兩個介面主要是為了“訪問物件相關屬性”和“獲取元資料相關資訊”。BeanDefinition的主要定義物件

影象處理工具包ImagXpress常見問題解答

ImagXpress是一組影象處理庫,可將影象處理新增到Windows應用程式中。此成像SDK通過藉助影象編輯,轉換,壓縮和顏色調整等功能,以及易於實現的程式碼和全面的程式碼示例可輕鬆新增影象處理和操作到Windows應用程式。ImagXpress的優點: 數十種影象處理功能 易於

Web伺服器學習總結web伺服器簡介

一、WEB伺服器 1.1、WEB伺服器簡介   1、Web伺服器是指駐留於因特網上某種型別計算機的程式,是可以向發出請求的瀏覽器提供文件的程式。當Web瀏覽器(客戶端)連到伺服器上並請求檔案時,伺服器將處理該請求並將檔案反饋到該瀏覽器上,附帶的資訊會告訴瀏覽器如何檢視該檔案(即檔案型別)。   

Python影象處理庫PIL的Image模組介紹

(Image模組方法16-25) 16、  Paste 定義1:im.paste(image,box) 含義1:將一張圖貼上到另一張影象上。變數box或者是一個給定左上角的2元組,或者是定義了左,上,右和下畫素座標的4元組,或者為空(與(0,0)一樣)。如果給定4元組,

初級程式設計師面試題總結

本人將這幾天面試的題目總結一些,如果出現錯誤請指正,謝謝。 1,談一談spring。 答:spring是為java程式開發提供的綜合性的基礎java開發平臺,它提供了從表現層SpringMVC到業務層Spring再到持久層springData的一套完整的解決