1. 程式人生 > >[學習筆記]實時SLAM的未來及深度學習與SLAM對比

[學習筆記]實時SLAM的未來及深度學習與SLAM對比

實時SLAM的未來及深度學習與SLAM對比

The Future of Real-Time SLAM and Deep Learning vs SLAM學習筆記

本文是作者(Tombone)對2015年12月18日計算機視覺國際會議實時SLAM小組討論要點的總結。原文發表在作者的部落格上,地址參見本文最後。這篇文章主要介紹了會議上的7個話題,在最後聊了一些關於深度學習討論組的一些資訊。

第一部分:為什麼SLAM重要

vSALM(Visual SLAM)能夠在跟蹤攝像機(用於AR的手持或者頭盔,或者裝備在機器人上)位置和方位的同時構建三維地圖. SLAM演算法與ConvNets和深度學習是互補的。SLAM關注幾何問題,而深度學習主要關注識別問題。如果你想讓機器人走到冰箱面前而不撞到牆,就用SLAM。如果你想讓機器人識別冰箱裡的物品,就用ConvNets。

http://openmvg.readthedocs.io/en/latest/

SLAM相當於實時版本的SFM(Structure From Motion)。vSLAM使用攝像機,放棄了昂貴的鐳射感測器和慣性感測器(IMU)。單目SLAM使用單個相機,而非單目SLAM通常使用預先標定好的固定基線的立體攝像機。SLAM是基於幾何方法的計算機視覺的一個主要的例子。事實上,CMU(卡內基梅隴大學)的機器人研究機構劃分了兩個課程:基於學習方法的視覺和基於幾何方法的視覺。

SFM vs vSLAM

SFM和SLAM解決的是相似的問題,但SFM是以傳統的離線的方式來實現的。SLAM慢慢地朝著低功耗,實時和單個RGB相機模式發展。下面是一些流行的開源SFM軟體庫。

vSLAM vs 自動駕駛

自動駕駛汽車是SLAM最重要的一個應用領域。未來很多年裡,在自動駕駛領域將持續地研究SLAM。

第二部分:實時SLAM的未來

Andres Davison做了一個非常精彩的關於15年來基於視覺的SLAM的總結。過去10-15年來最典型的幾個SLAM系統如下:

  • MonoSLAM
  • PTAM
  • FAB-MAP
  • DTAM
  • KinectFusion

Davison vs Horn: 機器人視覺的下一篇

Davision正在寫一本新的機器人視覺的書,該書第一版由B.K. Horn1986年出版。另外有兩本很優秀的圖書值得學習。他們分別是Hartlet等著的<Multiple View Geometry>和Thrun等著的<Probabilistic Robotics>。這兩本書可堪稱SLAM的經典基礎,必讀。

Talk 1: Christian Kerl on Continuous Trajectories in SLAM

Talk 2: Semi-Dense Direct SLAM by Jakob Engel

LSD-SLAM在2014年的ECCV上誕生,是我比較喜歡的一個SLAM系統。LSD_SLAM是Large-Scale Direct Monocular SLAM的縮寫。LSD-SLAM對SLAM研究者來說是一個重要的系統,因為它沒有使用角點(corners)或者其他任何本地特徵(local features)。

原文:LSD-SLAM is an important system for SLAM researchers because it does not use corners or any other local features. Direct tracking is performed by image-to-image alignment using a coarse-to-fine algorithm with a robust Huber loss. This is quite different than the feature-based systems out there. Depth estimation uses an inverse depth parametrization (like many other SLAM systems) and uses a large number or relatively small baseline image pairs. Rather than relying on image features, the algorithms is effectively performing “texture tracking”. Global mapping is performed by creating and solving a pose graph "bundle adjustment" optimization problem, and all of this works in real-time. The method is semi-dense because it only estimates depth at pixels solely near image boundaries. LSD-SLAM output is denser than traditional features, but not fully dense like Kinect-style RGBD SLAM.

LSD-SLAM的擴充套件包括Omni(全景) LSD-SLAM和Stereo(立體) SLAM。

Talk 3: Sattler on The challenges of Large-Scale Localization and Mapping

Talk 4: Mur-Artal on Feature-based vs Direct-Methods

ORB-SLAM的建立者Raúl Mur-Artal的演講集中在Feature-based和Direct-methond的爭論上。他堅定地站在feature-based這邊。ORB-SLAM是一個優秀的開源SLMA系統。

Talk 5: Project Tango and Visual loop-closure for image-2-image constraints

谷歌的Project Tango是世界上首個試圖將SLAM商業化的產品。谷歌想將SLAM能力納入到下一代Android裝置上。

Talk 6: ElasticFusion is DenseSLAM without a pose-graph

ElasticFusion是一個稠密SLAM技術,它需要類似Kinect的RGBD感測器。

Talk 7: Richard Newcombe’s DynamicFusion

Richard Newcombe是最後一個演講者,他創辦的公司最近被Oculus收購了。看到DTAM,KinectFusion和DynamicFusion背後的人如今投入到VR領域,這真是一件很酷的事。

第三部分:深度學習 vs SLAM

SLAM討論組非常有意思。在我們進入深度學習與SLAM的重要性討論之前,我應該提到每個討論組的演講者都認為:語義(semantics)對於構建一個更大,更好的SLAM系統是非常必要的。

整合語義資訊進入SLAM

結束語

今天的SLAM系統幫助機器從幾何的角度來理解現實世界,而深度學習則幫助機器進行合理地分類。最後與大家分享一下Newcombe和Davision在視覺SLAM中的令人興奮的事:基於視覺的演算法即將把AR/VR變成數十億美金的市場。然而,我們不應該忘記密切關注一個萬億美金的市場,那就是機器人。SLAM機器人的時代即將到來。

相關推薦

[學習筆記]實時SLAM未來深度學習SLAM對比

實時SLAM的未來及深度學習與SLAM對比 The Future of Real-Time SLAM and Deep Learning vs SLAM學習筆記 本文是作者(Tombone)對2015年12月18日計算機視覺國際會議實時SLAM小組討論要點的總結。

推薦系統(Remmender System)學習筆記(二)--基於深度學習的推薦系統

關於session-based recommender system相關演算法以及論文筆記: 1.the item-to-item recommendation approach 《Item-based collaborative filtering recommendat

深度學習筆記(十二)--深度學習資料集MNIST、ImageNet、 COCO 、 VOC介紹

1.  MNIST 深度學習領域的“Hello World!”,入門必備!MNIST是一個手寫數字資料庫,它有60000個訓練樣本集和10000個測試樣本集,每個樣本影象的寬高為28*28。此資料集是以二進位制儲存的,不能直接以影象格式檢視,不過很容易找到將其轉換成

學習筆記︱Nvidia DIGITS網頁版深度學習框架——深度學習版SPSS

DIGITS: Deep Learning GPU Training System1,是由英偉達(NVIDIA)公司開發的第一個互動式深度學習GPU訓練系統。目的在於整合現有的Deep Learning開發工具,實現深度神經網路(Deep Ne

CTR學習筆記&程式碼實現1-深度學習的前奏LR->FFM

CTR學習筆記系列的第一篇,總結在深度模型稱王之前經典LR,FM, FFM模型,這些經典模型後續也作為元件用於各個深度模型。模型分別用自定義Keras Layer和estimator來實現,哈哈一個是舊愛一個是新歡。特徵工程依賴feature_column實現,這裡做的比較簡單在後面的深度模型再好好搞。完整程

深度 | ICCV研討會:實時SLAM未來以及深度學習SLAM的比較(附論文和PPT)

選自 Computer Vison Blog 作者:Tomasz Malisiewicz 機器之心編譯 參與:吳攀、杜夏德 深度學習、計算機視覺和演算法正在塑造人工智慧的未來。 上一屆「國際計算機視覺大會(ICCV:International Con

ICCV研討會:實時SLAM未來以及深度學習SLAM的比較

轉載宣告:本文轉載自  金木炎 的部落格http://blog.csdn.net/qq_18661939/article/details/51919329,僅供個人學習。感謝博主的無私分享,如有侵權,敬請告知。這篇短文寫的很好,我把它copy到這裡供大家學習上一屆「國際計算機

人工智慧中小樣本問題相關的系列模型演變學習筆記(三):遷移學習深度遷移學習

【說在前面】本人部落格新手一枚,象牙塔的老白,職業場的小白。以下內容僅為個人見解,歡迎批評指正,不喜勿噴![握手][握手] 【再囉嗦一下】本文銜接上兩個隨筆:人工智慧中小樣本問題相關的系列模型演變及學習筆記(一):元學習、小樣本學習 【再囉嗦一下】本文銜接上兩個隨筆:人工智慧中小樣本問題相關的系列模型演變及學

struts2學習筆記——常見報錯解決方法匯總(持續更新)

允許 clip 之間 con ack 技術 ext tro height 操作環境:(1)Tomcat 7.0.72.0      (2)OS Name: Windows 7      (3)JVM Version: 1.8.0_25-b18      (4)e

Oracle學習筆記—oracle體系架構狀態(nomount、mount和open)簡介

位置 正常 處理 管理 共享服務器 體系 操作記錄 sysdba png oracle體系架構簡介 先來簡要了解一下Oracle數據庫體系架構以便於後面深入理解,Oracle Server主要由實例(instance)和數據庫(database)組成。實例(instance

HTML學習筆記 css定位浮動瀑布流 第十三節 (原創)

oct adding styles gin ima alt eight div height <!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8">

HTML學習筆記 基礎標簽css引用案例 第一節 (原創)參考使用表

set utf har del 文件 定義 .com eight head <!DOCTYPE html><!--頭文件 不是標簽 也沒有結束,這是聲明該文件為HTML5--><html lang="en"><!--表示網頁文字以什

HTML學習筆記 css定位浮動瀑布流案例 第十三節 (原創) 參考使用表

20px 筆記 lis containe use cor ack 100% set #fd { width: 100px; height: 150px; background-color: forestgreen; float: left;

【安全牛學習筆記】tcpdump簡介常用命令實例

信息安全 tcpdump security+ tcpdump簡介 tcpdump 是一個運行在命令行下的嗅探工具。它允許用戶攔截和顯示發送或收到過網絡連接到該 計算機的TCP/IP和其他數據包。tcpdump 是一個在BSD許可證下發布的自由軟件。

Mysql DBA 高級運維學習筆記-sql語言介紹分類

刪除表 def sele 數據庫管理 sql語句 中文意思 從表 use dba 8.1 什麽是sql SQL英文全稱是Structured Query Language,中文意思是結構化查詢語言。它是一種對關系型數據庫中的數據進行定義和操作的語言方法。是大多數關系數據庫管

Mysql DBA 高級運維學習筆記-mysql雙主多主同步過程

配置 ble use key 間隔 into base fse char 1.Mysql雙主及多主同步實戰,互為主從 使用主主前提: a.表的主鍵自增(M庫id1,3,5;M庫id 2,4,6) 準備:兩臺機器,這裏用多實例來講解 第一臺: Ip:192.168.1.115

Teaching Machines to Understand Us 讓機器理解我們 之三 自然語言學習深度學習的信仰

boa ping beats pen des pla 遇到 muc net Language learning 自然語言學習 Facebook’s New York office is a three-minute stroll up Broadway from LeCun

深度學習學習筆記(一):logistic regressionGradient descent 2018.9.16

寫在開頭:這是本人學習吳恩達在網易雲課堂上的深度學習系列課程的學習筆記,僅供參考,歡迎交流學習! 一,先介紹了logistic regression,邏輯迴歸就是根據輸入預測一個值,這個值可能是0或者1,其影象是一條s形曲線,由預測值與真實值的差距計算出loss function損失函式和cos

OpenCV學習筆記(31)KAZE 演算法原理原始碼分析(五)KAZE的原始碼優化SIFT的比較

  KAZE系列筆記: 1.  OpenCV學習筆記(27)KAZE 演算法原理與原始碼分析(一)非線性擴散濾波 2.  OpenCV學習筆記(28)KAZE 演算法原理與原始碼分析(二)非線性尺度空間構建 3.  Op

以太坊智慧合約學習筆記:開發流程工具鏈使用

本文主要介紹開發流程和工具鏈的使用,安裝過程百度上有好多,這裡就不贅述了 網上隨便找了一個智慧合約的例子,咱們來做一個投票系統,先用傳統的中心化方案去實現,然後在過度到區塊鏈1.0,最後再用區塊鏈2.0,感受一下開發思想的不同。 業務分析 傳統