計算機視覺（七）：特徵檢測/提取（feature detection/extraction）

關鍵點檢測和匹配流水線四個階段
一、背景知識

1. 影象特徵
2. 數字函式的一階導數和二階導數
3. 導數與影象特徵關係

二、孤立點的檢測
三、線檢測
四、邊緣檢測

1. 邊緣模型
2. 基本邊緣檢測
3. Marr-Hildreth邊緣檢測器
4. 坎尼邊緣檢測器（Canny）
5. 邊緣連線和邊界檢測

五、程式碼實現（Python+OpenCV)（未完，待續）

關鍵點檢測和匹配流水線四個階段

① 特徵檢測/提取（feature detection）：
      特徵檢測/提取的過程指從每一幅影象中尋找那些能在其他影象中較好匹配的位置。
      另外需要注意的是，這裡也涉及影象分割的內容。分割將影象細分為構成它的子區域或物體。細分的程度取決於要解決的問題。也就是說，在應用中，當感興趣的物體或區域已經被檢測出來時，就停止分割。
② 特徵描述（feature description）：
      特徵描述即把檢測到的關鍵點周圍的每一個區域轉化成一個更緊湊和穩定（不變的）的描述子。
      使用影象分割的方法將一幅影象分割成多個區域後，分割後的畫素集合經常需要以一種適合於計算機進一步處理的形式來表示和描述，此時我們可以使用特徵描述子對其進行描述。
③ 特徵匹配（feature matching）：
      特徵匹配即在其他影象中高效地搜尋可能的匹配候選。一旦我們從兩幅或多幅影象中提取特徵及其描述子，下一步就是要在這些影象之間建立一些初始化特徵之間的匹配。
④ 特徵跟蹤（feature tracking）：
      特徵跟蹤是第三個階段的另一種替代方法，它只在檢測到的特徵點周圍一個小的領域內尋找匹配，因此更適合視訊處理。
以上介紹將貫徹接下來要介紹的特徵檢測/提取、影象分割、特徵描述、特徵匹配、特徵跟蹤。

一、背景知識

1. 影象特徵

      本文主要介紹灰度空間的特徵檢測，所討論的特徵檢測跟特徵提取有相同的概念，特徵被檢測後它可以從影象中被提取出來。我們感興趣的三種影象特徵是孤立點、線、邊緣。
      邊緣畫素是影象中灰度突變的那些畫素，而邊緣是相連邊緣畫素的集合。邊緣檢測器是設計用來檢測邊緣畫素的區域性影象處理方法。
      一條線可視為一條邊緣線段，該線兩側的背景灰度要麼遠亮於該線的畫素的灰度，要麼遠暗於該線的畫素的灰度。
      類似的，孤立點可視為一條線，只是其長度和寬度都為一個畫素。

2. 數字函式的一階導數和二階導數

      我們在空間域濾波器中介紹過一階微分和二階微分的差分形式。若將函式 $f(x+\Delta x)$ 展開為關於 $x$ 的泰勒級數，令 $\Delta x = 1$ ，且只保留該級數的線性項，結果數字差分是：
${∂f\over ∂x} = f'(x) = f(x+1) - f(x)$       對上式關於 $x$ 微分，我們得到一個二階導數表示式：
${∂^2f\over ∂x^2} = {∂f'(x)\over ∂x} = f'(x+1) - f'(x) = f(x+2) + f(x) - 2f(x+1)$       這一展開是關於點 $x+1$ 的，我們的興趣是關於點 $x$ 的二階導數，故將上式中的變數減1後，得到
${∂^2f\over ∂x^2} = f''(x) = f(x+1) + f(x-1) - 2f(x)$

3. 導數與影象特徵關係

      ① 一階導數通常在影象中產生較粗的邊緣。
      ② 二階導數對精細細節，如細線、孤立點和噪聲有較強的響應。
      ③ 二階導數在灰度斜坡和灰度臺階過渡處會產生雙邊緣響應。
      ④ 二階導數的符號可用於確定邊緣的過渡是從亮到暗還是從暗到亮。

二、孤立點的檢測

孤立點的檢測以二階導數為基礎，這意味著使用拉普拉斯運算元（詳細可見空間域濾波器）：
$\nabla^2f(x,y) = f(x+1,y) + f(x-1,y) + f(x,y+1) + f(x,y-1) - 4f(x,y)$ 輸出是使用如下表達式得到的：
$g(x,y) = \begin{cases}1, & \text {$|R(x,y) \geq T$|} \\ 0, & \text{其他} \end{cases}$ 式中， $g$ 是輸出影象， $T$ 是一個非負的閾值， $R$ 由上式的拉普拉斯運算元給出。從直觀上看，這一概念是一個孤立點的灰度將完全不同於其周圍畫素的灰度，因而，使用這種型別的模板可很容易地檢測出這個孤立點。

三、線檢測

複雜度更高的檢測是線檢測。對於線檢測，可以預期二階導數將導致更強的響應，併產生比一階導數更細的線。我們可以使用拉普拉斯運算元，另外，必須適當處理二階導數的雙線效應，這裡可以使用拉普拉斯的正值實現。
通常，我們的興趣在於檢測特定方向的線，對於不同方向的線，我們可以使用以下模板（其中角度是相對於正x軸度量的角度）：
在這裡插入圖片描述

四、邊緣檢測

1. 邊緣模型

邊緣檢測基於灰度突變。邊緣的三種模型分別為：臺階模型、斜坡模型、屋頂邊緣模型，如圖1所示：
在這裡插入圖片描述

圖1 從左到右分別為臺階模型、斜坡模型、屋頂邊緣模型（理想表示）以及它們的相應灰度剖面

一階導數的幅度可用於檢測影象中的某個點處是否存在一個邊緣（存在邊緣則導數不為0）；二階導數的符號可用於確定一個邊緣畫素是位於該邊緣的暗測還是位於該邊緣的亮側（正為暗、負為亮）。
圍繞一條邊緣的二階導數有兩個附加性質：① 對影象中的每條邊緣，二階導數生成兩個值（一個不希望的特點）；② 二階導數的零交叉點可用於定義粗邊緣的中心，具體見圖2。
在這裡插入圖片描述

圖2 由一條理想垂直邊緣分開的兩個恆定灰度區域；邊緣附近的細節，顯示了一個水平灰度剖面及其一階導數和二階導數

執行邊緣檢測有以下三個步驟：
① 為降噪對影象進行平滑處理。
② 邊緣點的檢測。這是一個區域性操作，從一幅影象中提取所有的點，這些點是變為邊緣點的潛在候選者。
③ 邊緣定位。這一步的目的是從候選邊緣點中選擇組成邊緣點集合的真實成員。
以下討論實現這三個步驟的一些技術。

2. 基本邊緣檢測

以下邊緣檢測使用一階導數。
① Roberts運算元
Roberts運算元以求對角畫素之差為基礎，該運算元用於識別對角線方向的邊緣：
$g_x = (z_9 - z_5)\ \ \ 和\ \ \ g_y = (z_8 - z_6)$ 模板如下圖所示：
在這裡插入圖片描述

② Prewitt運算元
Prewitt運算元使用以 $z_5$ 為中心的 $3\times 3$ 鄰域對 $g_x$ 和 $g_y$ 的近似如下式所示：
$g_x = (z_7 + z_8 + z_9) - (z_1 +z_2 +z_3)$

相關推薦

計算機視覺（七）：特徵檢測/提取（feature detection/extraction）

關鍵點檢測和匹配流水線四個階段一、背景知識 1. 影象特徵 2. 數字函式的一階導數和二階導數 3. 導數與影象特徵關係二

6.影象的數學運算（影象運演算法則）+ ROI特徵項提取（畫面疊化效果） --- OpenCV從零開始到影象（人臉 + 物體）識別系列

本文作者：小嗷影象的基本運算有很多種，比如兩幅影象可以相加、相減、甚至可以相乘、相除(與或非、異或、與或)，我們可以把相同規格的影象（數字）進行加減乘除等等，實現處理後圖像的還原與合併。 dst：輸出影象，src1：

計算機視覺（三）：目標檢測與識別

1 - 引言目標檢測和識別，是計算機視覺最常見的挑戰之一。目標檢測和識別的區別在於：目標檢測是用來確定影象的某個區域是否含有要識別的物件，而識別是程式識別物件的能力。識別通常只處理已檢測到物件的區域。在計算機視覺中有很多目標檢測和識別的技術梯度直方圖（Hist

計算機視覺（一）：人臉檢測和識別

1 - 引言之前我們學習了機器學習和數字影象處理的相關知識，瞭解了基本的概念理論和OpenCV和TensorFlow框架的使用，現在我們可以結合這些知識與工具寫出屬於我們自己的計算機視覺專案，本文主要介紹瞭如何使用OpenCV提供的函式來構建一個人臉識別和檢測的應用 2 - Haa

OpenCV2學習筆記（十）：特徵點檢測之Harris法

在計算機視覺中，特徵點的概念被大量用於解決物體識別、影象匹配、視覺跟蹤、三維重建等問題，比如影象中物體的角點，它們是在影象中可被輕易而精確地定位的二維特徵。顧名思義，特徵點檢測的思想是無需觀察整幅影象，而是通過選擇某些特殊點，然後對它們執行區域性分析。如果能檢測

演算法導論第七章：快速排序筆記（快速排序的描述、快速排序的效能、快速排序的隨機化版本、快速排序分析）

快速排序的最壞情況時間複雜度為Θ(n^2)。雖然最壞情況時間複雜度很差，但是快速排序通常是實際排序應用中最好的選擇，因為它的平均效能很好。它的期望執行時間複雜度為Θ(n lg n)，而且Θ(n lg n)中蘊含的常數因子非常小，而且它還是原址排序的。快速排序是一種排序演算法，對包含n個數的

c語言數字影象處理（九）：邊緣檢測

背景知識邊緣畫素是影象中灰度突變的畫素，而邊緣是連線邊緣畫素的集合。邊緣檢測是設計用來檢測邊緣畫素的區域性影象處理方法。孤立點檢測使用<https://www.cnblogs.com/GoldBeetle/p/9744625.html>中介紹的拉普拉斯運算元輸出影象為卷積模

tensorflow利用預訓練模型進行目標檢測（二）：將檢測結果存入mysql資料庫

mysql版本：5.7 ；資料庫：rdshare；表captain_america3_sd用來記錄某幀是否被檢測。表captain_america3_d用來記錄檢測到的資料。 python模組，包部分內容參考http://www.runoob.com/python/python-modules.html&

機器學習筆記（十七）：TensorFlow實戰九（經典卷積神經網路：ResNet）

1 - 引言我們可以看到CNN經典模型的發展從 LeNet -5、AlexNet、VGG、再到Inception，模型的層數和複雜程度都有著明顯的提高，有些網路層數更是達到100多層。但是當神經網路的層數過高時，這些神經網路會變得更加難以訓練。一個特別大的麻煩就在於訓練的時候會產

opencv學習（二十一）：圓檢測

檢測原理：參考連結：https://www.cnblogs.com/ssyfj/p/9275977.html#一houghcircles方法

opencv學習（二十）：直線檢測

霍夫直線檢測原理： 1、對於直角座標系中的任意一點A(x0,y0)，經過點A的直線滿足Y0=k*X0+b.(k是斜率，b是截距) 2、那麼在X-Y平面過點A(x0,y0)的直線簇可以用Y0=k*X0+b表示，但對於垂直於X軸的直線斜率是無窮大的則無法表示。因此將直角座標系轉換到極座標系就能解

R繪圖第七篇：繪製條形圖（ggplot2）

使用geom_bar()函式繪製條形圖，條形圖的高度通常表示兩種情況之一：每組中的資料的個數，或資料框中列的值，高度表示的含義是由geom_bar()函式的引數stat決定的，stat在geom_bar()函式中有兩個有效值：count和identity。預設情況下，stat="count"，這意味著每個條的

機器學習筆記（十四）：異常檢測

目錄 1）Problem motivation 2）Gaussian distribution 3）Algorithm 4）Developing and evaluating an anomaly detection system 5）Anomaly detection vs

論文筆記：目標檢測演算法（R-CNN，Fast R-CNN，Faster R-CNN，YOLOv1-v3）

R-CNN（Region-based CNN） motivation：之前的視覺任務大多數考慮使用SIFT和HOG特徵，而近年來CNN和ImageNet的出現使得影象分類問題取得重大突破，那麼這方面的成功能否遷移到PASCAL VOC的目標檢測任務上呢？基於這個問題，論文提出了R-CNN。基本步驟：如下圖

移動推薦演算法（三）：特徵構建

本文為轉載文章，來源為： https://blog.csdn.net/Snoopy_Yuan/article/details/75105724 一直在探索資料探勘、資料建模的案例，百度搜到這篇文章，收穫頗豐，轉載以作記錄。移動推薦演算法是阿里天池賽2015年賽題之一，題

Redis入門（七）：Redis分散式鎖（單機模式/叢集模式）

Redis 實現分散式鎖單機模式的Redis分散式鎖優缺點實現比較輕，大多數時候能滿足需求；因為是單機單例項部署，如果redis服務宕機，那麼所有需要獲取分散式鎖的地方均無法獲取鎖，將全部阻塞，需要做好降級處理。當鎖過期後，執行任務的程序還沒有

OpenCV探索之路（六）：邊緣檢測（canny、sobel、laplacian）

邊緣檢測的一般步驟：濾波——消除噪聲增強——使邊界輪廓更加明顯檢測——選出邊緣點 Canny演算法 Canny邊緣檢測演算法被很多人推崇為當今最優秀的邊緣檢測演算法，所以我們第一個就介紹他。 opencv中提供了Canny函式。 #include<

數字影象處理筆記（十一）：邊緣檢測演算法

1 - 引言在影象識別中，如果可以將影象感興趣的物體或區別分割出來，無疑可以增加我們影象識別的準確率，傳統的數字影象處理中的分割方法多數基於灰度值的兩個基本性質不連續性、以灰度突變為基礎分割一副影象，比如影象的邊緣相似性根據一組預定義的準則將一副影象分割為相似

Scala入門到精通——第七節：類和物件（二）

本節主要內容單例物件伴生物件與伴生類 apply方法應用程式物件抽象類單例物件在某些應用場景下，我們可能不需要建立物件，而是想直接呼叫方法，但是Scala語言並不支援靜態成員，Scala通過單例物件來解決該問題。單例物件的建立方式如下：

python資料分析：異常檢測分析（Anomaly detection analysis）

何為異常檢測在資料探勘中，異常檢測（anomaly detection）是通過與大多數資料顯著不同而引起懷疑的稀有專案，事件或觀察的識別。通常情況下，異常專案會轉化為某種問題，例如銀行欺詐，結構缺陷，醫療問題或文字錯誤。異常也被稱為異常值，新奇，噪聲，偏差和異常。資料異常可以