第7講視覺里程計2 --- 求解相機的運動

阿新 • • 發佈：2018-12-17

上一篇部落格中學習了特徵提取和匹配的概念，並且呼叫OpenCV庫實現了ORB特徵的提取和匹配。

找到了匹配點後，我們希望能夠根據匹配的點對來估計相機的運動。由於相機的原理不同，情況就變得有點複雜了：

當相機為單目的時候，我們只知道2D的畫素座標，因而問題是根據兩組2D點估計運動。該問題用對極幾何來解決。
當相機為雙目、RGB-D時，或者通過某種方法得到了距離資訊，那麼問題就是根據兩組3D點估計運動。該問題通常用ICP來解決。
如果有3D點及其在相機的投影位置，也能估計相機的運動。該問題通過PnP來求解。

1、對極約束

下面先來看一下兩個相鄰幀之間的匹配點有什麼關係？

以上圖為例，我們設從 $I_{1}$ 到 $I_{2}$ 的運動為 $R,\vec{t}$ ，兩個相機的中心分別為 $O_{1},O_{2}$ 。

現在，假設 $I_{1}$ 中有一個特徵點 $p_{1}$ ，它在 $I_{2}$ 中對應的點為 $p_{2}$

（我們知道這是通過特徵匹配得到的，如果匹配結果正確的話，就可以認為 $p_{1},p_{2}$ 是同一個空間點在兩個成像平面上投影）

現在，我們假設匹配結果是正確的，然後就可以開始下面的數學推導了：

在 $I_{1}$ 的座標系下，設點 $P$ 的空間位置為 $P=[X,Y,Z]^{T}$ ，

根據針孔相機模型可以知道，兩個畫素點 $p_{1},p_{2}$ 的畫素位置滿足：

$z_{1}p_{1}=KP$ ， $z_{2}p_{2}=K(RP+t)$

因為使用的是齊次座標，所以在上式的左邊乘以任意一個非零常數也是成立的，則有：

$p_{1}=KP$ ， $p_{2}=K(RP+t)$

現在取兩個畫素點在歸一化平面上的座標： $x_{1}=K^{-1}p_{1}$ ， $x_{2}=K^{-1}p_{2}$ ，代入上式中得：

$x_{2}=Rx_{1}+t$

然後兩邊同時左乘 $t^{\Lambda }$ ，注意： $t^{\Lambda }t=t\times t=0$ ，得：

$t^{\Lambda }x_{2}=t^{\Lambda }Rx_{1}$

然後，兩式同時左乘 $x_{2}^{T}$ ，得到：

$x_{2}^{T}t^{\Lambda }x_{2}=x_{2}^{T}t^{\Lambda }Rx_{1}$

因為 $t^{\Lambda }x_{2}=t\times x_{2}$ 是一個和 $t,x_{2}$ 都垂直的向量，所以： $x_{2}^{T}t^{\Lambda }x_{2}$ =0，則有：

$x_{2}^{T}t^{\Lambda }Rx_{1}=0$

將 $x_{1},x_2$ 的值重新代入得到：

${\color{Red} p_{2}^{T}K^{-T}t^{\Lambda }RK^{-1}p_{1}=0}$

上式就稱之為對極約束，它的幾何意義是 $O_1,O_2,P$ 共面。

我們把上式的中間兩個部分記為兩個矩陣：基礎矩陣（Fundamental matrix）F、本質矩陣（Essential matrix）E

${\color{Red} E=t^{\Lambda }R}$ ， ${\color{Red} F=K^{-T}t^{\Lambda }RK^{-1}=K^{-T}EK^{-1}}$

於是對極約束進一步簡化為下式：

有了上面的基礎之後，相機的位姿估計問題就可以分解為下面兩步：

（1）根據相鄰幀配對點的畫素位置求出E或者F

（2）根據E或者F求出R, t

注：由對極幾何的表示式也可以知道利用對極幾何僅根據配對的畫素點位置就可以求相機運動，記為 2D-2D 問題（瞎說的）

2、本質矩陣E

上面說了，根據 E 或者 F 都可以求出R, t，E 和 F 之間相差的就是相機內參K，而相機的內參矩陣在SLAM問題中一般是已知的，所以我們經常使用形式更加簡單的本質矩陣E 來求解相機的運動。

根據定義，本質矩陣 $E=t^{\Lambda}R$ ，它是一個3*3的矩陣，內有9個未知數。另一方面，由於旋轉和平移各有3個自由度，故 $E=t^{\Lambda}R$ 一共有6個自由度，但由於尺度等價性， $E$ 實際上只有5個自由度。 $E$ 具有5個自由度的事實，表明我們最少可以用5對點來求解 $E$ 。但是 $E$ 的內在性質是一種非線性性質，在求解線性方程時會帶來麻煩，因此，也可以只考慮它的尺度等價性，使用8對點來估計 $E$ ---------這就是經典的八點法。（ps: 我對這段話不是很理解）

接下來的問題就是如何根據估計到的本質矩陣 $E$ ，來分解出R和t了。這個過程是通過奇異值分解得到的。

3、單應矩陣H

單應矩陣H，描述了兩個平面之間的對映關係。若場景中的特徵點都落在同一個平面上（比如牆、地面），則可以通過單應性來進行運動估計。這種情況在無人攜帶的俯視星際或者掃地機攜帶的頂視相機中比較常見。

下面從數學的角度說明一下什麼是單應矩陣：

考慮在影象 $I_{1},I_{2}$ 上有一對匹配好的特徵點 $p_{1},p_{2}$ ，這些特徵點落在平面 $P$ 上，設這個平面的方程為：

$n^{T}P+d=0$

整理一下，就是：

$-\frac{n^{T}P}{d}=1$

又因為： $p_{2}=K(RP+t)$ ，可以得到：

$p_{2}=K(RP+t(-\frac{n^{T}P}{d}))=K(R-\frac{tn^{T}}{d})P=K(R-\frac{tn^{T}}{d})K^{-1}p_{1}$

令 $H=K(R-\frac{tn^{T}}{d})K^{-1}$ ，於是 $p_{2}=Hp_{1}$ （H就是所謂的單應矩陣）

自由度為8的單應矩陣可以通過4對匹配特徵點算出（這些特徵點不能有三點共線的情況），然後通過H分解得到R，t。

計算出兩幅影象之間的單應矩陣H之後，可以有如下用途：

（1）根據H分解出相機的運動R、t

（2）應用 $p_{2}=Hp_{1}$ 這個關係可以將一個檢視中的所有點變換到另一個圖的視角下的圖片。

第7講視覺里程計2 --- 求解相機的運動

上一篇部落格中學習了特徵提取和匹配的概念，並且呼叫OpenCV庫實現了ORB特徵的提取和匹配。找到了匹配點後，我們希望能夠根據匹配的點對來估計相機的運動。由於相機的原理不同，情況就變得有點複雜了：當相機為單目的時候，我們只知道2D的畫素座標，因而問題是根據兩組2

視覺里程計2（SLAM十四講ch7）-對極幾何，三角測量

對極幾何 2D2D 對極幾何（Epipolar Geometry）是Structure from Motion問題中，在兩個相機位置產生的兩幅影象的之間存在的一種特殊幾何關係，是sfm問題中2D-2D求解兩幀間相機姿態的基本模型。相機位姿估計問題——》 1.根據配對點

第三篇視覺里程計（VO）的初始化過程以及openvslam中的相關實現詳解

視覺里程計（Visual Odometry, VO），通過使用相機提供的連續幀影象資訊（以及區域性地圖，先不考慮）來估計相鄰幀的相機運動，將這些相對執行轉換為以第一幀為參考的位姿資訊，就得到了相機載體（假設統一的剛體）的里程資訊。初始化例項在例項化跟蹤器的時候會例項化一個初始化例項，有一些比較重要的引數需

SLAM入門之視覺里程計(6)：相機標定張正友經典標定法詳解

https://www.cnblogs.com/wangguchangqing/p/8335131.html 想要從二維影象中獲取到場景的三維資訊，相機的內參數是必須的，在SLAM中，相機通常是提前標定好的。張正友于1998年在論文："A Flexible New Technique fro C

視覺slam 14講第7講程式碼執行問題 fatal error: g2o/solvers/eigen/linear_solver_eigen.h

測試高博的視覺slam 第7講的實驗時到對應的目錄下 ch7裡，建立build資料夾，進入，cmake.. make這個時候出了個問題。程式編譯的時候，到這一行 #include <g2o/solvers/csparse/linear_solver_csp

《視覺SLAM十四講》第7講程式碼編譯g2o初始化出錯修改

1. pose_estimation_3d3d.cpp // 初始化g2o typedef g2o::BlockSolver< g2o::BlockSolverTraits<6,3> > Block; // pos

第7講++創建數據表和約束

ref gin mar reat 數據外鍵唯一約束 log weight 二、創建數據表 1.創建簡單的數據表 --命令格式 --create table 表名 -- (列定義列約束 [,……n]) --實例1：在xscj庫中,創

CS184.1X 計算機圖形學導論第7講 V1-3 學習筆記

線上物體創建 strong 公式推導導論幾何 ng- 解決方法 L7V1：OPENGL 著色：學習動機 1.光照的重要性 1）能夠真正顯示出形狀感知的外觀； 2）準確的著色和光照對對傳達物體的形狀非常重要； 3）著色的方式也十分重要：平面著色（GL_FLAT）、平滑

初始視覺里程計

起因臨近大四的時候，被告知畢業設計要做與機器人相關的題目。於是導師給了一個足球場上實現移動機器人視覺自定位的功能。拿到這個題目，萬般無奈，毫無頭緒，身邊的人也沒有搞過這個的，根本不知道這個東西到底是個啥。查看了很多很多文章，都是很多的理論性的東西，對於想實現但基本零基礎的我來說真的是毫

【Python例項第7講】真實資料集的異常檢測

機器學習訓練營——機器學習愛好者的自由交流空間（qq 群號：696721295）在這個例子裡，我們闡述在真實資料集上的穩健協方差估計的必要性。這樣的協方差估計，對異常點檢測，以及更好地理解資料結構都是有益的。為了方便資料視覺化，我們選擇來自波士頓房價資料集的兩個變數

VO：簡單的視覺里程計程式碼註釋

走完SLAM十四講前端之後，程式碼都已經註釋完，但還是感覺有點迷茫，所以專門參考馮兵的部落格，實現簡單的視覺里程計。收穫是又重新認識到了C++基礎的薄弱，決定之後的晚上要刷牛客題。不過就SLAM前端而言這部分基本可以理解程式碼了，這篇對VO程式碼進行註釋。基本過程： 1、獲取影象 2、對

第7講 7.ElasticSearch簡單查詢

1，新增索引film（分片5，副本1），建立對映關係dongzuo類，和其它欄位(tittle，publishDate，content，director， price)，可以參考上一節知識；在Java程式碼中新增測試資料， { "properties": {

第7講 .資料庫自動建立表SpringBoot

1. 新增jar包，新增jpa 的支援，mysql的支援， 2. 建立資料庫，資料庫名為為：db_book

什麼是視覺里程計（Visual Odometry）?

概念：什麼是里程計？在里程計問題中，我們希望測量一個運動物體的軌跡。這可以通過許多不同的手段來實現。例如，我們在汽車輪胎上安裝計數碼盤，就可以得到輪胎轉動的距離，從而得到汽車的估計。或者，也可以測量汽車的速度、加速度，通過時間積分來計算它的位移。完成這種運動估計的裝置（包括硬體和演算法

無人駕駛視覺-單目視覺里程計

対極幾何通過兩幀影象的運動，利用匹配點，求解相機的位姿變換。（就是得到R，t）步驟： 1. 根據配對點的畫素位置,求出 E 或者 F ; 2. 根據 E 或者 F ,求出 R, t。問題單目視覺的尺度不確定性(Scale Ambiguity)。例如,程式中

JAVA入門到精通-第88講-山寨QQ專案2-好友列表介面

好友列表介面：卡片整個是一個JPanel，Border佈局的Panel JButton，我的好友；中間也是一個JPanel JScrollPane該控制元件放了一個JPanel（GridLayout(10,1)）好友列表；網格佈局，10-10個好友；

里程計、推算定位與視覺里程計

本文來自 lxiaoxiaot 的CSDN 部落格，全文地址請點選：https://blog.csdn.net/lxiaoxiaot/article/details/6779936?utm_source=copy 里程計（Odometry）：原文連結在此：http://e

乾貨 | Matlab實現單目視覺里程計基於SURF特徵（程式碼類）

博主github：https://github.com/MichaelBeechan 博主CSDN：https://blog.csdn.net/u011344545 SURF特徵提取參考：https://blog.csdn.net/u01134454

SpringBoot專欄_web：模板引擎Thymeleaf使用實戰，圖文結合附帶原始碼下載（第7講）

簡介： Thymeleaf是一款用於渲染XML/XHTML/HTML5內容的模板引擎。類似JSP， Velocity，FreeMaker等，它也可以輕易的與Spring MVC等Web框架進行整合作為Web應用的模板引擎。與其它模板引擎相比，Thymeleaf最大的特點是能夠直接在

JVM系列第7講：JVM 類載入機制

當 Java 虛擬機器將 Java 原始碼編譯為位元組碼之後，虛擬機器便可以將位元組碼讀取進記憶體，從而進行解析、執行等整個過程，這個過程我們叫：Java 虛擬機器的類載入機制。JVM 虛擬機器執行 class 位元組碼的過程可以分為七個階段：載入、驗證、準備、解析、初始化、使用、解除安裝。在開始聊之前，先