1. 程式人生 > >《計算機視覺-一種現代方法(第2版)》讀書筆記三:早期視覺(一幅影象)

《計算機視覺-一種現代方法(第2版)》讀書筆記三:早期視覺(一幅影象)

本篇思維導圖

這裡寫圖片描述

線性濾波器

線性濾波器的主要策略是用不同的加權模式計算畫素加權和,以尋找不同的影象模式

1.線性濾波和卷積

  • 二維卷積公式:Rij=u,vHiu,jvFu,v,使HFR
  • 幾種常見的線性濾波:平均平滑、高斯平滑、導數和有限差分

2.移不變線性系統

2.1 三大性質

  • 疊加性
  • 按比例縮放
  • 位移不變性

2.2 離散卷積和連續卷積的性質

  • 對稱的: (gh)(x)=(hg)(x)
  • 可結合的: (f(gh))=((fg)h)

2.3 離散卷積的邊緣效應

在邊緣處計算有些畫素位置的卷積值時,需要虛擬並不存在的影象值,採用的策略有

  • 忽略這些點
  • 使用常數填充
  • 使用其他方法填充影象

3 空間頻率和傅立葉變換

二維傅立葉變換:
這裡寫圖片描述
效果圖:
這裡寫圖片描述

4.取樣和摺疊失真

  • 取樣

這裡寫圖片描述

  • 摺疊失真
    原始訊號中的高頻空間元素在取樣訊號中會表現為低頻元素,這種效應稱為摺疊失真

這裡寫圖片描述

  • 重取樣

5.濾波器與模板

濾波器對類似濾波器的模式元素有很強的響應

6.技術

6.1 歸一化相關和檢測

6.2 尺度和影象金字塔

影象金字塔是以金字塔形狀排列的解析度逐步降低,且來源於同一張原始圖的影象集合

  1. 高斯金字塔
    在高斯金字塔中,每一層使用一個對稱的高斯核進行平滑,同時進行重取樣以獲得下一層
  2. 多尺度表示
    *多尺度搜索:小影象模式
    *空間搜尋:在兩張圖片中找到對應點,由粗到精的匹配
    *特徵跟蹤:跟蹤特徵到較粗糙尺度,接收在較粗糙尺度下能找到對應的精細尺度特徵

區域性影象特徵

導致影象亮度劇烈變化的因素:

  • 封閉輪廓線攜帶形狀資訊
  • 反射率的劇烈變化攜帶紋理資訊
  • 表面方向的劇烈變化也告訴我們形狀
  • 光照的變化告訴我們光源的位置

1 計算影象梯度

I=(Ix,Iy)T

  • 有限差分(影象梯度的近似)
    這裡寫圖片描述
    注:簡單的有限差分往往會對噪聲有較強的相應,解決的方法是先平滑影象再對它進行差分(可在畫素尺度上抑制噪聲)
  • 高斯濾波器的導數
    (GσI)x=(G
    σ
    x
    )I

2 表示影象梯度

  • 兩種重要的影象梯度表示方法:計算邊緣、使用梯度方向
  • 基於梯度的邊緣檢測器

3 找到角點(corner)和建立鄰域(blob)

3.1 找到角點

在角點處,應該有大的梯度並且在小的鄰域內,梯度的方向應該劇烈變化

Harris角點檢測器

  • 原理:在角點視窗,影象高斯平滑後的二階導數矩陣H的兩個特徵值都比較大
  • 公式:尋找下式的區域性極大值
    det(H)k(trace(H)2)2,k
  • 特點:檢測器不受平移和旋轉影響

3.2 通過縮放和方向建立鄰域

  • 使用角點檢測器獲得模式元素的位置、半徑和方向
    這裡寫圖片描述

  • 使用高斯模糊影象的拉普拉斯變換(求二階導)獲得模式元素的位置、半徑和方向
    這裡寫圖片描述

4 使用SIFT和HoG特徵描述鄰域

  • SIFT(Scale Invariant Feature Transform)特徵(是經典的尺度不變特徵)
    這裡寫圖片描述

  • HOG(Histogram Of Gradient orientations)特徵(是SIFT特徵的一個重要變體)
    這裡寫圖片描述

紋理

1 什麼是紋理

紋理是一種廣泛存在,容易識別(對人而言)又很難定義的東西,紋理常常顯示出重複性,是物體識別的重要線索,也是材料性質的重要線索

2 區域性紋理表示

  • 影象紋理通常由重複的元素(紋理基元)組成(是一組紋理基元按照某種方式重複形成的)
  • 區域性紋理表示可以通過使用一組不同尺度的濾波器對影象濾波然後將結果進行綜合得到
    這裡寫圖片描述
    注:不同尺度的紋理濾波器通常是點狀和條狀

  • 區域性紋理表示(紋理的濾波器響應)圖示
    這裡寫圖片描述
    注:在一點的紋理表示應該包含鄰近濾波器輸出的綜合,而不僅僅是它們自身的濾波器輸出

3 合併紋理表示(紋理識別)

  • 向量量化和紋理:向量量化是從一個固定尺寸集中用數字表示在連續時空中的向量
  • 使用K均值聚類進行向量量化
    這裡寫圖片描述

4 資料驅動的紋理表示(紋理合成)

相關推薦

計算機視覺-現代方法2讀書筆記早期視覺影象

本篇思維導圖 線性濾波器 線性濾波器的主要策略是用不同的加權模式計算畫素加權和,以尋找不同的影象模式 1.線性濾波和卷積 二維卷積公式:Rij=∑u,vHi−u,j−vFu,v,使用卷積核H將圖像F卷積到域R 幾種常見的線性濾波:平均平滑、

《黑客攻防技術寶典Web實戰篇@2讀書筆記1了解Web應用程序

金融 主機 border ket 邊界 輕量 在線 讀書 目的 讀書筆記第一部分對應原書的第一章,主要介紹了Web應用程序的發展,功能,安全狀況。 Web應用程序的發展歷程 早期的萬維網僅由Web站點構成,只是包含靜態文檔的信息庫,隨後人們發明了Web瀏覽器用來檢索和

《人工智慧現代方法17章複雜決策問題學習筆記

前言 本篇文章來自Artificial Intelligence: A Modern Approach一書第17章“複雜決策問題”,進行了翻譯和整理,僅供學習參考。 正文 在之前的章節中討論了單個決策問題,這些問題特點是行動帶來的效用是完全知道的,而接下來討論的序貫決策問題,效用

計算機視覺-現代方法2讀書筆記中層視覺

本篇思維導圖 注:中層視覺主要關注的是影象中的幾何結構以及特定物件和目標,應用領域包括目標分割和跟蹤 通過聚類分割 分割的目的是為了得到一幅圖片中有用部分的一個精簡的表示,其具體的理論和方法取決於應用的需求 1 人類視覺:分類和格式塔(Gesta

計算機視覺-現代方法2讀書筆記導論大綱

前言 作為CV(Computer Vision)方向的研究生,一直想要系統地瞭解和學習一下CV的基本知識,理清CV發展的脈絡。而David Forsyth的《Computer Vision-A Modern Approach(2nd edition)》是CV領

計算機視覺-現代方法2讀書筆記高層視覺

本篇思維導圖影象配準(Registration)1.配準剛性物體變換:旋轉(rotation)、平移(translation)、縮放(scale) ∑i[(sR(θ)xi+t)−yc(i)]2∑i[(sR(θ)xi+t)−yc(i)]2迭代最近點:通過估計對應點尋找正確的變換

《C語言程式設計現代方法2K.N.King 著》學習筆記C語言概述

1.1 C語言的歷史 1.1.1 起源 C語言是美國貝爾實驗室的 Dennis Ritchie、Ken Thompson 等人為開發 UNIX 作業系統而於 1972 年設計的一種計算機程式語言。

分享《OpenCV 3計算機視覺Python語言實現2》中文PDF+英文PDF+原始碼

下載:https://pan.baidu.com/s/1gGgEk8Y6X58gfvsmD8U8Xw 更多資料分享:https://www.cnblogs.com/javapythonstudy/ 《OpenCV 3計算機視覺:Python語言實現(第2版)》中文PDF+英文PDF+原始碼中文PDF,20

《C語言程式設計現代方法2K.N.King 著》學習筆記C語言基本概念2

2.3 註釋 每一個程式都應該包含識別資訊,即程式名、編寫日期、作者、程式的用途以及其他相關資訊。C語言把這類資訊放在註釋(comment)中。 符號 /* 標記註釋的開始,而符號 */ 則標記註釋

《C語言程式設計現代方法2K.N.King 著》學習筆記C語言基本概念3

2.5 讀入輸入 為了獲取輸入,就要用到 scanf 函式。它是C函式庫中與 printf 相對應的函式。scanf 中的字母 f 和 printf 中的字母 f 含義相同,都是表示“格式化”的意思

《C語言程式設計現代方法2K.N.King 著》學習筆記C語言基本概念4

2.7 識別符號 在編寫程式時,需要對變數、函式、巨集和其他實體進行命名。這些名字稱為識別符號(identifier)。在C語言中,識別符號可以含有字母、數字和下劃線,但是必須以字母或者下劃線開頭。

《C語言程式設計現代方法2K.N.King 著》學習筆記C語言基本概念5

問與答 GCC 最初是 GNU C Compiler 的簡稱。現在指 GNU Compiler Collection,這是因為最新版本的 GCC 能夠編譯用 Ada、C、C++、Fortran、Ja

《C語言程式設計現代方法2K.N.King 著》學習筆記格式化輸入/輸出2

3.2 scanf 函式 就如同 printf 函式用特定的格式顯示輸出一樣,scanf 函式也根據特定的格式讀取輸入。像 printf 函式的格式串一樣,scanf 函式的格式串也可以包含普通字元

計算機程序的構造和解釋2》【PDF】下載

ger car 教材 推薦 教育 5.5 系統 log nbsp 《計算機程序的構造和解釋(第2版)》【PDF】下載鏈接: https://u253469.pipipan.com/fs/253469-230382255 內容簡介 《計算機程序的構造和解釋(原書第2

計算機圖形學2 於萬波 於碩 編著45頁的Bresenham算法有錯誤

str mage mov 步長 分享圖片 圖片 方法總結 tro 計算 計算機圖形學(第2版 於萬波 於碩 編著)第45頁的Bresenham算法有錯誤: 書上本來要寫的是以x為階越步長的方法,但是他寫的是用一部分y為階越步長的方法(其實也寫的不對),最後以x為階越

《SpringBoot實戰讀書筆記-- 入門

1、SpringBoot最重要的四個核心:自動配置、起步依賴、命令列介面、Actuator(Springboot提供對應用系統的自省和監控的整合功能,可以對應用系統進行配置檢視、相關功能統計等)。     Springboot自動配置消除了傳統Spring應用程式中的很多樣板

翻譯《計算機體系結構--量化研究方法附錄F向量化部分

1. 何出向量處理器?在第2、3章我們看到了如何通過每個時鐘週期發射多條指令和利用更深的執行單元流水線來開發指令級並行(ILP)以顯著提高效能。(這個附錄假定你已經完整閱讀了第2、3章和附錄G。另外,對向量處理器的記憶體系統的討論需要你閱讀附錄C和第5章。)不幸的是,我們看到在挖掘更大程度的 ILP 的時候

數據庫系統工程師教程2目錄

體系結構 多媒體 觸發 評估 實現 決策 可靠性 邏輯結構設計 視頻 北漂不易,為了所謂的“綠卡”,也為了以後能夠讓為孩子創造更好的條件;同時也為了充實下自己,終於下定決心,努力吧。 先從軟考開始《數據庫系統工程師教程》中級,以下純手碼,共勉 第

精通CSS高級Web標準解決方式2

avi css dsm table 段落 空元素 支持 :after med 精通CSS:高級Web標準解決方式(第2版) 跳轉至: 導航、 搜索 層疊重要度:(也就是說。用戶!important能夠覆蓋inline style)

PostgreSQL即學即用2pdf

pla 通過 3.3 back 系統文件 pga 靈活 多條 ext 下載地址: 網盤下載 內容簡介 · · · · · ·本書將幫助你理解和使用PostgreSQL 這一開源數據庫系統。你不僅會學到版本9.2、9.3 和9.4中的企業級特性,還會發現PostgreSQ