1. 程式人生 > >從零開始一起學習SLAM(1)為什麼要學SLAM?

從零開始一起學習SLAM(1)為什麼要學SLAM?

從零開始一起學習SLAM | 為什麼要學SLAM?

  計算機視覺的研究目前主要分為兩大方向:基於學習的方法和基於幾何的方法。其中基於學習的方法最火的就是深度學習,而基於幾何方法最火的就是視覺SLAM

img

  SLAM將成為計算機視覺的下一個風口

  在前幾年計算機視覺的三大頂級會議(CVPR,ICCV,ECCV)上,幾乎全是深度學習的研究,而這樣的情況在這兩年出現了新的變化:在2018年計算機視覺國際頂級會議 CVPR論文錄用名單中,其中涉及SLAM/三維視覺 的工作超過 90 篇,佔據了全體收錄論文的近 1/10。

  而今年參加校招和社招的小夥伴也向我透露,今年深度學習方向的競爭非常激烈,想要拿到較好的offer,要麼有牛叉閃閃的論文,要麼是大牛實驗室有過硬的專案經驗,難度比前幾年大大提升。而今年SLAM方向的需求量上升而相關從業者相對較少,相對還比較容易,類似幾年前深度學習剛剛火起來之前的樣子。可以預見,SLAM將成為繼深度學習之後計算機視覺領域的下一個風口。主要有以下幾個依據:

  1、深度學習在檢測、識別領域具有無比強大的能力,但是在涉及多視角幾何相關的SLAM領域,深度學習的作用非常有限。究其原因是因為在多視角幾何為基礎的SLAM領域,需要明確清晰的理論基礎保證,而深度學習的「黑盒子」模型目前還不太奏效。

  2、SLAM技術門檻較高。深度學習爆發後,很多非計算機視覺領域的從業者紛紛轉而學習深度學習,由於深度學習本身黑盒子的特點,很多從業者不需要了解影象處理、計算機視覺的基礎知識便可以得到一個相對較好的結果,因此入門門檻並不是很高。

  而學習SLAM則需要具備三維空間剛體變換、相機成像模型、特徵點提取與匹配、多視角幾何、捆集調整等內容。這對於非該領域的從業者來說還是具有較高的門檻。

  3、消費級RGB-D相機快速發展催生了以三維視覺為基礎的商業化應用。以微軟Kinect系列、Intel realsense系列、蘋果、英飛凌、TI等為代表的消費級RGB-D相機逐漸形成成熟的產業鏈,國內也湧現出大量的優秀企業並量產,如orbbec、pico、human+、愛觀、圖漾、艾芯智慧、知微感測等。此外,2017年iPhone X前置結構光深度相機面世後,更是激發了手機產業鏈RGB-D相機的熱潮,目前華為、小米、OPPO、VIVO等手機大廠都在積極推動RGB-D相機在手機上的應用。

img

  4、目前計算機視覺領域主要還是通過二維的圖片來感知世界,而三維視覺才是人類感知理解世界的正確方式,因此以三維視覺為基礎的SLAM技術是智慧移動機器人、無人駕駛、AR等人工智慧細分領域的核心技術

img

  目前對SLAM技術需求強烈的公司包括:網際網路公司如百度、騰訊、阿里、京東等,計算機視覺演算法公司如曠世、虹軟、商湯等,自動駕駛創業公司如圖森、momenta、景馳、馭勢、滴滴及各大汽車廠商等,無人機/機器人公司如大疆、思嵐、高仙等,AR移動終端應用相關公司如三星、華為、悉見等。

  總之,SLAM前景光明但學習道路曲折,這也是筆者打算和讀者一起從零開始學習SLAM的初衷。