三維計算機視覺（七）--Spin image

阿新 • • 發佈：2019-01-21

Spin image是基於點雲空間分佈的最經典的特徵描述方法。

Spin image的思想是將一定區域的點雲分佈轉換成二維的spin image，然後對場景和模型的spin images進行相似性度量。原理圖如下：

大寫P------三維網格某頂點p的切面

n-------p點單位法向量

x-------p附近的三維網格上的另一個頂點

α------x點在P上投影與p的距離

β------x點與P點的垂直距離

其中p和n定義為一個定向點(Oriented point)。

一、生成一個spin image的步驟：

1.定義一個Oriented point

2.以Oriented point為軸生成一個圓柱座標系

3.定義Spin image的引數，Spin image是一個具有一定大小（行數列數）、解析度（二維網格大小）的二維影象（或者說網格）。Spin image的三個關鍵引數將在後面討論。

4.將圓柱體內的三維座標投影到二維Spin image，這一過程可以理解為一個Spin image繞著法向量n旋轉360度，Spin image掃到的三維空間的點會落到Spin image的網格中。就是如下的公式：

從三維空間投影到spinimage座標

5.根據spin image中的每個網格中落入的點不同，計算每個網格的強度I，顯示spin image時以每個網格（也就是畫素）I不同為依據。最直接的方法是直接計算每個網格中落入的點，然而為了降低對位置的敏感度降低噪音影響增加穩定性，Johnson論文中用雙線性插值的方法將一個點分佈到4個畫素中。原理如下圖：

雙線性插值

上圖中，預設的網格（畫素）邊長是1（真實邊長的選擇會在稍後討論），當一個點落入網格（i,j）中時會被雙線性插值分散到（i,j）、（i,j+1）、（i+1,j）、（i+1,j+1）四個網格中。

這樣就獲得了spin image，如下圖所示。

spin image

如上圖所示，第一副圖很巧選擇的是一個那片區域中沒有比選擇的點更凸出的點，spin image就像一副帶粘性的砧板，繞著所選擇頂點的法向量軸自轉360°，所到之處的質點全部被粘到板上，累積成一副影象，在經過處理就成了spin image。

二、spin image的三個關鍵引數

1.解析度，即二維網格的也就是畫素的實際尺寸，使用和三維網格相近的尺寸比較合適，因此通常是取三維網格所有邊的平均值來作為spin image的每個網格尺寸，通常會把網格的長和寬定義成相等，即邊長，邊長的計算公式：

e為三維網格模型中的一條邊，N為三維網格模型中的邊的總數。

2.大小，即spin image的行數和列數，兩者一般也相等。可以參考的大小10x10或20x20等。

3.support angle,即法向量夾角的大小限制。空間中頂點的法向量與建立圓柱座標系所選點法向量之間的夾角。效果如下圖：

可以看出，對角度限制以後，那些相當於切面的“凹點（大於90°）”被剔除，保留了主要資訊，降低了後續的計算量。一般角度限制範圍為60°--90°之間。

三.spin image特徵匹配中的相似性度量和匹配時點的選擇

1.相似性度量

使用以下公式來計算兩個spin images之間的相似性：

其中R的計算公式：

N為每個spin image畫素數，atanh為反雙曲正切函式，其輸入的範圍[-1,1]，原文中解釋為這是一種典型的統計學手段。R的取值範圍是[-1,1]，兩個spin images越相似R越接近於1，完全一樣時R的值為1。

可以看出C由兩部分組成第一部分是經反雙曲正切函式得出的值的平方，第二部分是一個權重λ乘以一個較小的數，當兩個spin images相似時第二部分所佔比重應較小，當不接近時第二部分所佔比重應較大，λ起的作用是用來限制spin images低重合時匹配的情況。文中對λ的選擇方式是將所有的spin images中的非空畫素數按大小順序列出來然後取中位數。這個中位數差不多是畫素重疊的期望值。然後考慮到低重疊的情況，取這個中位數的一半來作為λ。

三維模型與場景匹配按下圖的流程進行

如上圖所示，計算出相關係數之後，會面臨一個問題就是對於模型上的一個點，在場景中可能會有不止一個點與目標點的特徵相近匹配，原因是模型的對稱部分或者目標點附近的點的干擾。所以在確定Plausible correspondences的時候要進行過濾以及多元組匹配。文中給出了兩種過濾的方法。

確定Plausible correspondences之後就可以計算出Plausible Transformation。之後再用ICP演算法進行精確匹配就可以得到精確的匹配。

2.模型和場景匹配時點的選擇

兩個三維模型之間至少得有三個點匹配才能確定匹配。

對三維場景點的選擇：

通過對形狀編碼確保均勻抽樣，通過選擇有精確法向量的spin image來提高匹配的機率。無雜點的完美模型一般隨機選擇10%的點就夠了，實際運用中一般選擇1/20-1/2。

對三維模型點的選擇使用了相似度量直方圖的方法

總結：Spin Image對遮擋和背景干擾具有很強的穩健性，在點雲配準和三維目標識別中得到廣泛應用，其不足之處在於不具有尺度不變性，需要較大的儲存空間和要求點雲均勻分佈。

Reference:

1.Andrew Edie Johnson.Spin-Images: A Representation for 3-D Surface Matching.1997

2.郭裕蘭.距離影象區域性特徵提取方法綜述.2011

3.劉瑤.基於自旋圖的三維自動目標識別.2012

三維計算機視覺（七）--Spin image

三維計算機視覺（七）--Spin image

三維計算機視覺（五）--特徵描述子

三維計算機視覺（三）--點雲分割

計算機視覺（七）：特徵檢測/提取（feature detection/extraction）

計算機視覺（七）

計算機視覺（七）：構建兩層的神經網路來分類Cifar-10資料集

三維精密測量（一） —— 一種求圓標誌中心亞像素級邊緣標定算法

計算機視覺（一）概述

基於數字光柵投影的結構光三維測量技術（總結）

計算機視覺（二）：直方圖均衡

計算機視覺（一）：基礎篇

計算機視覺（六）：頻率域濾波器

計算機視覺（五）：頻率域濾波基礎

計算機視覺（四）：空間域濾波器

計算機視覺（八）：影象分割

計算機網路之我見-通俗理解計算機網路（七）

python基礎教程（第三版)學習筆記（七）

SFM三維重建原始碼（Matlab）

計算機視覺（二）

計算機視覺（六）

三維計算機視覺（七）--Spin image

相關推薦