1. 程式人生 > >三維計算機視覺(七)--Spin image

三維計算機視覺(七)--Spin image

Spin image是基於點雲空間分佈的最經典的特徵描述方法。

Spin image的思想是將一定區域的點雲分佈轉換成二維的spin image​,然後對場景和模型的spin image​s進行相似性度量。原理圖如下:

大寫P------三維網格某頂點p的切面

n-------p點單位法向量

​x-------p附近的三維網格上的另一個頂點

α------x點在P上投影與p的距離

β------x點與P點的垂直距離

其中p和n定義為一個定向點(Oriented point)。

一、生成一個spin image的步驟:

1.定義一個​Oriented point

2.以Oriented point為軸生成一個圓柱座標系

​3.定義Spin image的引數,Spin image是一個具有一定大小(行數列數)、解析度(二維網格大小)的二維影象(或者說網格)。Spin image的三個關鍵引數將在後面討論。

4.將圓柱體內的三維座標​投影到二維Spin image,這一過程可以理解為一個Spin image繞著法向量n旋轉360度,Spin image掃到的三維空間的點會落到Spin image的網格中。就是如下的公式:

從三維空間投影到spinimage座標

5.根據spin image中的每個網格中落入的點不同,計算每個網格的強度I,顯示spin image時以每個網格(也就是畫素)I不同為依據。最直接的方法是直接計算每個網格中落入的點,然而為了降低對位置的敏感度降低噪音影響增加穩定性,Johnson論文中用雙線性插值的方法將一個點分佈到4個畫素中。原理如下圖:

雙線性插值

上圖中,預設的網格(畫素)邊長是1(真實邊長的選擇會在稍後討論),當一個點落入網格(i,j)中時會被雙線性插值分散到(i,j)、(i,j+1)、(i+1,j)、(i+1,j+1)四個網格中。

這樣就獲得了spin image,如下圖所示。​

spin image

​如上圖所示,第一副圖很巧選擇的是一個那片區域中沒有比選擇的點更凸出的點,spin image就像一副帶粘性的砧板,繞著所選擇頂點的法向量軸自轉360°,所到之處的質點全部被粘到板上,累積成一副影象,在經過處理就成了spin image。

二、spin image的三個關鍵引數

1.​解析度,即二維網格的也就是畫素的實際尺寸,使用和三維網格相近的尺寸比較合適,因此通常是取三維網格所有邊的平均值來作為spin image的每個網格尺寸,通常會把網格的長和寬定義成相等,即邊長,邊長的計算公式:

​e為三維網格模型中的一條邊,N為三維網格模型中的邊的總數。

2.大小,即spin image的行數和列數​,兩者一般也相等。可以參考的大小10x10或20x20等。

3.​support angle,即法向量夾角的大小限制。空間中頂點的法向量與建立圓柱座標系所選點法向量之間的夾角。效果如下圖:

可以看出,對角度限制以後,那些相當於切面的“凹點(大於90°)”被剔除,保留了主要資訊,降低了後續的計算量。一般角度限制範圍為60°--90°之間。

三.spin image特徵匹配​中的相似性度量和匹配時點的選擇

​1.相似性度量

使用以下公式來計算兩個spin images之間的相似性:

其中R的計算公式:

​N為每個spin image畫素數,atanh為反雙曲正切函式,其輸入的範圍[-1,1],原文中解釋為這是一種典型的統計學手段。R的取值範圍是[-1,1],兩個spin images越相似R越接近於1,完全一樣時R的值為1。

可以看出​C由兩部分組成第一部分是經反雙曲正切函式得出的值的平方,第二部分是一個權重λ乘以一個較小的數,當兩個spin images相似時第二部分所佔比重應較小,當不接近時第二部分所佔比重應較大,λ起的作用是用來限制spin images低重合時匹配的情況。文中對λ的選擇方式是將所有的spin images中的非空畫素數按大小順序列出來然後取中位數。這個中位數差不多是畫素重疊的期望值。然後考慮到低重疊的情況,取這個中位數的一半來作為λ。

​三維模型與場景匹配按下圖的流程進行

​如上圖所示,計算出相關係數之後,會面臨一個問題就是對於模型上的一個點,在場景中可能會有不止一個點與目標點的特徵相近匹配,原因是模型的對稱部分或者目標點附近的點的干擾。所以在確定Plausible correspondences的時候要進行過濾以及多元組匹配。文中給出了兩種過濾的方法。

確定​Plausible correspondences之後就可以計算出Plausible Transformation。之後再用ICP演算法進行精確匹配就可以得到精確的匹配。

​2.模型和場景匹配時點的選擇

兩個三維模型之間至少得有三個點匹配才能確定匹配。

對三維場景點的選擇:

通過對形狀編碼確保均勻抽樣,通過選擇有精確法向量的spin image來提高匹配的機率。無雜點的完美模型一般隨機選擇10%的點就夠了​,實際運用中一般選擇1/20-1/2。

對三維模型點的選擇​使用了相似度量直方圖的方法

總結:Spin Image對遮擋和背景干擾具有很強的穩健性,在點雲配準和三維目標識別中得到廣泛應用,其不足之處在於不具有尺度不變性,需要較大的儲存空間和要求點雲均勻分佈。

Reference:

1.Andrew Edie Johnson​.Spin-Images: A Representation for 3-D Surface Matching.1997

2.郭裕蘭.距離影象區域性特徵提取方法綜述.2011

3.劉瑤.基於自旋圖的三維自動目標識別.2012

相關推薦

計算機視覺--Spin image

Spin image是基於點雲空間分佈的最經典的特徵描述方法。 Spin image的思想是將一定區域的點雲分佈轉換成二維的spin image​,然後對場景和模型的spin image​s進行相似性度量。原理圖如下: 大寫P------三維網格某頂點p的切面 n-

計算機視覺--特徵描述子

PPF 機器人視覺中有一項重要人物就是從場景中提取物體的位置,姿態。影象處理演算法藉助Deep Learning 的東風已經在影象的物體標記領域耍的飛起了。而從三維場景中提取物體還有待研究。目前已有的思路是先提取關鍵點,再使用各種區域性特徵描述子對關鍵點進行描述,最後與待檢

計算機視覺--點雲分割

轉自:http://www.cnblogs.com/ironstark/p/5000147.html 點雲分割   點雲分割可謂點雲處理的精髓,也是三維影象相對二維影象最大優勢的體現。   點雲分割的目的提取點雲中的不同物體,從而實現分而治之,突出重點,單獨處理的目的。而在

計算機視覺:特徵檢測/提取feature detection/extraction

關鍵點檢測和匹配流水線四個階段 一、背景知識 1. 影象特徵 2. 數字函式的一階導數和二階導數 3. 導數與影象特徵關係 二

計算機視覺

影象描述:    Demo:   https://vimeo.com/146492001  http://cs.stanford.edu/people/karpathy/neuraltalk2/demo.html 二。最新的方法概述:    1. Neur

計算機視覺:構建兩層的神經網路來分類Cifar-10資料集

1 - 引言 之前我們學習了神經網路的理論知識,現在我們要自己搭建一個結構為如下圖所示的神經網路,對Cifar-10資料集進行分類 前向傳播比較簡單,就不在贅述 反向傳播需要注意的是,softmax的反向傳播與之前寫的softmax程式碼一樣。神經網路內部的反向傳播權重偏導就是前面

精密測量 —— 一種求圓標誌中心亞像素級邊緣標定算法

它的 圖像 擬合 bsp 亞像素 三維 時間 像素 面積 一、邊緣細定位邊緣 1 參數擬合法的基本原理 CCD是光積分器件,它以固定大小的面積在固定的時間間隔內對投影其感光面上的光強進行積分,輸出的結果就是圖像的灰度值。由於CCD的積分時間和面積是相對固

計算機視覺概述

一、什麼是計算機視覺 計算機視覺(Computer Vision)是一門如何使計算機“看”的學問,讓攝像頭和電腦代替人眼對目標進行識別、跟蹤、測量等機器視覺。計算機視覺能夠模擬人類視覺的優越的能力,如識別物體、估計立體空間與距離、躲避障礙、理解影象、想象影象的能力,一定程度上,計算機視覺

基於數字光柵投影的結構光測量技術總結

概述 三維重建 光學三維測量 被動三維測量 主動三維測量 基於PMP的結構光三維測量技術 結

計算機視覺:直方圖均衡

一、灰度空間的直方圖均衡 1.直方圖 2.變換函式應滿足條件 3.變換函式 4.直方圖均衡 二、彩色空間的直方圖均衡

計算機視覺:基礎篇

一、光和電磁波譜 二、彩色模型 1.RGB彩色模型 2.HSV彩色模型 3.從RGB到HSV的彩色轉換 4.從HSV到RGB的彩色轉換

計算機視覺:頻率域濾波器

一、濾波器 1. 基本濾波公式 2. 濾波步驟 3. 低通濾波器與高通濾波器 二、低通濾波器(平滑影象)

計算機視覺:頻率域濾波基礎

一、數學預備知識 1. 傅立葉級數 二、基本概念 1. 頻率域 2. 複數 3. 尤拉公式

計算機視覺:空間域濾波器

一、平滑空間濾波器 1. 平滑線性濾波器(均值濾波器) 2. 統計排序(平滑非線性)濾波器 二、銳化空間濾波器

計算機視覺:影象分割

一、閾值處理 1. 基礎知識 2. 基本的全域性閾值處理 3. 用Otsu方法的全域性閾值處理 4. 用影象平滑改善全域性閾值處理 5. 利用邊

計算機網路之我見-通俗理解計算機網路

本篇主要講解廣播、組播和IGMP協議(寫的比較倉促,質量不好~) 一、廣播 1 廣播的分類 廣播分為本地受限廣播和子網廣播 本地受限廣播的IP地址為255.255.255.255,只能在傳送主機所在的同一網段內進行傳播 子網廣播的IP地址為“網路號+主機號位數全為1”的地址,

python基礎教程版)學習筆記

第七章 再談抽象 自定義`類和物件 7.1 物件魔法 多型:可對不同型別的物件執行相同的操作,而這些操作就像“被施了魔法”一樣能夠正常執行。 封裝:對外部隱藏有關物件工作原理的細節。 繼承:可基於通用類創建出專用類。 7.1.1 多型 大致意味著即便你不知道變數指向的是哪種物件,也能夠對其執行操作,

SFM重建原始碼Matlab

這裡採用的是Yi Ma , Stefano Soatto. An Invitation to 3-D Vision , From Images to Geometric Models 的演算法 %// Algorithm 8.1. also 

計算機視覺

xtra roc 分類 match open 提取 水平 histogram svm 濾波和邊緣檢測 1. 空間濾波和頻域濾波   線性濾波和非線性濾波   滑動濾波:   blur 和 boxfilter、高斯濾波器是真正的低通濾波器、與boxfilter相比沒有振鈴現象

計算機視覺

影象檢索與相關應用 一。基於內容的影象檢索      分開展開:   HOG    SIFT:      GIST:      CNN:      最近鄰問題:      區域性敏感的雜湊:在高維空間和低維空間去保持距離