（一）影象座標：我想和世界座標談談(A) 【計算機視覺學習筆記--雙目視覺幾何框架系列】

阿新 • • 發佈：2019-01-12

玉米竭力用輕鬆具體的描述來講述雙目三維重建中的一些數學問題。希望這樣的方式讓大家以一個輕鬆的心態閱讀玉米的《計算機視覺學習筆記》雙目視覺數學架構系列部落格。這個系列部落格旨在捋順一下已標定的雙目視覺中的數學主線。數學推導是有著幾分枯燥的，但奇妙的計算機視覺世界是建立在嚴密的數學架構之上的。所以對數學框架的理解是理解雙目視覺的必由之路。不過請大家放心，接下來玉米會以儘量有趣，儘量更接地氣兒的方式，闡釋一下自己對雙目視覺數學或者說是投影幾何的理解。

先來張《計算機視覺：演算法與應用》中的3D重建示例圖鎮樓！

好吧，現在言歸正傳，來看看幾何學上世界是怎樣投影進攝相機裡的吧！接下來讓我們來看一下本系列部落格的第一“搏”：

影象座標：我想和世界座標談談(A)

首先，我先解釋一下這個題目吧。題目的字面意義是說：影象座標系想和世界座標系談談。這裡麵包含著兩個問題：

A、談話物件：視覺系統的三大座標系：世界座標系，攝像機座標系和影象座標系。這是玉米在本文《我想和世界座標談談 (A)》中想要和大家分享的內容。其中主要包含：三大座標系的位置、作用和應用場景。

B、談話方式：兩個不同的座標系之間該如何溝通呢？玉米將在《我想和世界座標談談(B)》中和大家分享一下剛體變換和透視投影變換。連起兩個座標系之間這不在一個參考系的“世界上最遠的距離”。

好吧，下面讓我們來揭開三大座標系的廬山真面目。

上圖是三個座標的示意簡圖，通過它大家可以對三個座標有一個直觀的認識。下面來看看三個座標系的骨子裡藏了什麼。

世界座標系（X_W,Y_W,Z_W）：其是目標物體位置的參考系。除了無窮遠，世界座標可以根據運算方便與否自由放置。在雙目視覺中世界座標系主要有三個用途：1、標定時確定標定物的位置2、作為雙目視覺的系統參考系，給出兩個攝像機相對世界座標系的關係，從而求出相機之間的相對關係3、作為重建得到三維座標的容器，盛放重建後的物體的三維座標。世界座標系是將看見中物體納入運算的第一站。

攝像機座標系(X_C,Y_C,Z_C)：其是攝像機站在自己角度上衡量的物體的座標系。攝像機座標系的原點在攝像機的光心上，z軸與攝像機光軸平行。它是與拍攝物體發生聯絡的橋頭堡，世界座標系下的物體需先經歷剛體變化轉到攝像機座標系，然後在和影象座標系發生關係。它是影象座標與世界座標之間發生關係的紐帶，溝通了世界上最遠的距離。哈哈

影象座標系(x,y)/(u,v) :其是以攝像機拍攝的二維照片為基準建立的座標系。用於指定物體在照片中的位置。玉米更傾向將(x,y)稱為連續影象座標或空間影象座標，將(u,v)稱為離散影象座標系或者是畫素影象座標系（雖然這樣的稱呼未經考證，但更能傳達二者的物理意義）。

(x,y)座標系的原點位於攝像機光軸與成像平面的焦點O’(u0,v0)上，單位為長度單位(米)。(u,v)座標系的原點在圖片的左上角（其實是儲存器的首地址）如上圖所示，單位為數量單位(個)。(x,y)主要用於表徵物體從攝像機座標系向影象座標系的透視投影關係。而(u,v)則是實實在在的，我們能從攝像機中得到的真實資訊。

(x,y)與(u,v)存在如下轉換關係：

dx代表x軸方向一個畫素的寬度，dy代表y軸方向上一個畫素的寬度。dx、dy為攝像機的內參數。(u0,v0)稱為影象平面的主點，也是攝像機的內參數。其實相當於對x軸和y軸的離散化。其可以運用齊次座標，將上式寫成矩陣形式，如下：

（1）式運用了齊次座標，初學者可能會感到有些迷惑。大家會問：怎樣將普通座標轉換為齊次座標呢？齊次座標能帶來什麼好處呢？

玉米在這裡對齊次座標做一個通俗的解釋。此處只講怎麼將普通座標改寫為齊次座標及為什麼引入齊次座標。這裡只做一個通俗但不太嚴謹的表述。力求簡單明瞭。針對齊次座標的嚴謹的純數學推導，可參見“周興和版的《高等幾何》---1.3拓廣平面上的齊次座標”。玉米曾詳細讀過《高等幾何》這本書，但覺得離計算機視覺有點遠，是講純數學的投影關係的，較為生澀難懂。

齊次座標可以理解為在原有座標後面加一個“小尾巴”。將普通座標轉換為齊次座標，通常就是在增加一個維度，這個維度上的數值為1。如影象座標系(u,v)轉換為(u,v,1)一樣。對於無窮遠點，小尾巴為0。注意，給零向量增加小尾巴，數學上無意義。

那麼，為什麼計算機視覺在座標運算時要加上這個“小尾巴”呢？

玉米看來有兩點原因：

1、將投影平面擴充套件到無窮遠點。如對消隱點(vanishing point)的描述。

2、使得計算更加規整

如式（1）如果用普通座標來表達的話，會是下面的樣子：

這樣的運算形式會給後與運算帶來一定的麻煩，所以齊次座標是一個更好的選擇。

齊次座標還有一個重要的性質，伸縮不變性。即：設齊次座標M，則αM=M。

轉至：http://blog.csdn.net/onthewaysuccess/article/details/40709745

（一）影象座標：我想和世界座標談談(A) 【計算機視覺學習筆記--雙目視覺幾何框架系列】

（一）影象座標：我想和世界座標談談(A) 【計算機視覺學習筆記--雙目視覺幾何框架系列】

Oracle知識梳理（一）理論篇：基本概念和術語整理

數字影象處理的筆記（一）第一部分：概念和應用領域

Tensorflow常見問題處理 TensorFlow 影象預處理（一）影象編解碼，影象尺寸調整 tensorflow(一)：圖片處理 TensorFlow 處理圖片

【一起學設計模式】狀態模式+裝飾器模式+簡單工廠模式實戰：（一）提交個訂單我到底經歷了什麼鬼？

學習之路（一）淺談：基礎命令及linux工作原理

讀《有效管理的5大兵法》筆記摘錄（一）核心價值觀：求實、進取、創新、協同、分享

（一）理解word2vec：原理篇

程式設計師用一段程式碼把眾人嚇一跳，網友：我想把寫程式碼的打一頓

java高併發（一）基本概念：併發和並行

C#.架構設計（一）敏捷開發：敏捷開發聯盟、開發工具、開發方法、C#敏捷開發

C# EmguCV學習筆記（一）---影象加減法操作

openCV Python 學習筆記（一）影象的基本操作

實習生面試經驗（一）-影象演算法崗

查詢演算法整理（一）---靜態查詢表：順序表查詢、折半（判定樹）查詢、靜態查詢樹

（一）前端開發：sublime text 3 安裝使用

石子合併（一）時間限制：1000 ms | 記憶體限制：65535 KB 難度：3 描述有N堆石子排成一排，每堆石子有一定的數量。現要將N堆石子併成為一堆。合併的過程只能每次將相鄰的兩堆

影象處理（一）影象變形(1)矩形全景影象還原-Siggraph 2014

OpenCV入門學習（一）影象放縮【簡單的按比例放縮，無技術含量】

【python】python資料結構（一）——線性表：順序表的實現

（一）影象座標：我想和世界座標談談(A) 【計算機視覺學習筆記--雙目視覺幾何框架系列】

相關推薦