小覓智慧:有了這雙“眼睛”,機器人和無人車在任何環境中都不會迷路 | 創業

圖片來源:pixabay
如何給機器人打造一雙在任何環境下自主定位導航的“眼睛”?
基礎創新是一個漫長的賽道, 不過對於矽谷連續創業家龐琳勇博士(Leo)來說,他早已習慣。“ ofollow,noindex">小覓智慧 是我的第三家創業公司,我的第二家公司從成立到最後被收購做了10年。這沒什麼奇怪的,賺快錢的公司很難有壁壘的。”龐琳勇以很自然的語氣回答。
畢業於美國斯坦福大學,擁有機械工程博士和電腦科學碩士(機器人視覺專業)的雙學位,並曾在中國科技大學師從光學測量泰斗伍小平院士,龐琳勇在立體視覺領域深耕多年並有多項研究成果。AI 時代的到來,讓他在自己擅長的領域看到了一個前所未有的剛需市場。
“每一次技術浪潮都會產生新的基礎建設需求。PC 時代,英特爾和微軟壟斷了 CPU 和作業系統;移動網際網路時代,ARM 攬括晶片,iOS 和安卓承包了作業系統;AI 時代的來臨,你會發現無論是機器人還是自動駕駛汽車,甚至 VR 和 AR 的應用,其共性特點是動起來了。”在琳勇看來,AI 時代高度強調“動”,而事物要運動,必須要有一雙認路和看得出距離的“人眼”——這便是他的專長。
2014 年,旨在讓機器人動起來的 小覓智慧 (MYNT AI)在矽谷成立了。其成員主要來自百度、三星、諾基亞、摩托羅拉等。
小覓智慧專注立體視覺技術整體解決方案,是行業領先的視覺定位導航 VPS(Visual Positioning System)核心技術提供商。VPS 核心技術包括自主研發的雙目結構光深度慣導相機、 視覺里程計 VIO(Visual-Inertial Odometry)技術、 VSLAM(Visual Simultaneous Localization And Mapping) 技術、自動駕駛、3D 識別/測量技術等。據龐琳勇介紹,小覓智慧提供三個維度的產品,一是基礎層:各種各樣的雙目深度攝像頭硬體;二是自動導航的底座,也就是雙目攝像頭加上 SLAM 的演算法,企業可以在上面開發自己的機器人;第三層是針對不同的行業做的定位導航定製方案,如服務機器人,掃地機機器人、汽車輔助駕駛 ADAS 等。
簡單來說,小覓智慧想給機器人和無人車(機)一雙靈敏的眼睛,幫助其自主行走。
說起機器視覺,目前最熱門、最主要的兩大類應用無非是識別和導航定位。小覓智慧則是後者。和用於手機等的二維感測器不同,深度感測器能夠把物體的距離測量出來。目前市面上的深度相機主要分為三種:時間飛行法 TOF(Time Of Flight)、雙目、結構光。這三種方法皆有優勢和侷限性。
- 結構光:屬於主動光類,演算法容易在晶片上實現,較為成熟,影象解析度比較高,但測量距離較短(1~2米),容易受光照影響,不適用於室外環境;
- TOF:屬於主動光類,演算法容易在晶片上實現,抗干擾性能較機構光要好, 深度精度高,不過其影象解析度較低(測的點少), 測量距離在5米左右,成本高;
- 雙目:屬於被動光類,室內外都工作,研究歷史較久,成本較低, 演算法精度高,魯棒性強,測量距離可以達到100米,但計算量大,演算法複雜。 因為非常依賴自然影象特徵匹配,所以不適用於昏暗環境或者過度曝光環境,另外如果被測場景本身缺乏紋理,也很難進行特徵提取和匹配,如白牆。
眾所周知,機器人面臨的環境各色各異,所以,機器人需要一雙適應任何環境的“眼睛”。而上述三個方案單一的來看都有明顯的不足。那麼,如何打造一款較為完美的定位導航和避障方案呢?這正是龐琳勇的初衷。小覓智慧以雙目為基礎,加入結構光,採用雙目的演算法,再加上位移加速感測器,形成了一套全新的完整的軟硬體一體化感測器方案。
“測量距離幾十米,深度精度達到釐米級,同時反應速度又很快,可以適應室內室外工作,在三種感測器中,只有應用自然光的雙目比較理想。但是雙目也有自身的侷限,它遇到室內白牆,無法找到特徵點,所以也就沒法匹配左右目的相同的特徵點,其精度就會下降。而利用結構光打紅外斑點到白牆上,相當於形成了圖案,即可輔助雙目分辨。”龐琳勇非常專業地解釋了結構光和雙目的結合點。
“我們的定位導航方案就像人眼,看了周圍就可以知道自己的相對位置。”龐琳勇解釋道, “小覓智慧其實在賦予機器人三維度空間感知的能力。這主要體現在兩個方面:定位導航和立體避障。首先,雙目攝像頭硬體需要測量機器人和各參照物的距離,然後用演算法算出具體位置,這是定位導航。至於避障,以前的機器人,基本是靠超聲避障。但超聲只知道前面有東西,卻不知道這個東西離你有多遠,寬度多少,高度多少。”龐琳勇解釋道,“機器人避障一定要知道障礙物的精確位置以及大小,而傳統超聲方案無法解決這些問題,視覺深度感測器則完美地解決了這一問題,所以很快成為機器人立體避障的標配。”除此之外,小覓智慧利用視覺感測和位移加速感測互補形成了一個更加全面的深度感測器。“視覺對轉動不太敏感,但是加速度感測器可以測出轉動的加速度,相當於是將不同渠道收集到的訊號融合在一起,保證了資訊精確。”他說。
關於機器人自主導航定位的方案,我們比較熟悉的有思嵐科技,其利用了視覺感測+鐳射雷達的方式。多感測融合會增加其魯棒性,但鐳射雷達的使用大大增加了成本。龐琳勇希望用視覺感測就可以讓機器人實現定位導航和避障, 實現低成本,易量產。而關於機器人的雙目軟硬體一體的研究,此前都主要存在於大學實驗室裡,真正應用到工業級場景的還沒有。值得一提的是,小覓智慧強實力的團隊一直致力於將這個技術應用帶出象牙塔。
針對不同行業機器人的不同需求,小覓已經推出了兩版雙目結構光深度慣導攝像頭:標準版和深度版。據龐琳勇介紹,標準版是雙目+結構光+位移加速感測器,後面的演算法是在主機上的 CPU 或 GPU 進行的。深度版本則是在標準版的基礎上加了專有晶片模組,可以直接運算,不用耗費主機上的運算資源。
“我們現在的商業模式主要是從深度攝像頭、到導航模組、再到針對不同行業和場景的機器人定位導航和避障的解決方案。小覓攝像頭有標杆型客戶,定位導航底盤得到了合作伙伴英偉達的推薦,業界的第一個雙目掃地機方案完成,至於服務機器人方案,我們現在正和一家公司在合作一個很特殊的場景,而且已經拿到幾千臺的這個場景的機器人的訂單了。”龐琳勇透露。
接下來,龐琳勇透露,小覓智慧在汽車輔助駕駛 ADAS 領域還可以大展拳腳。ADAS 輔助駕駛市場目前以單目攝像頭居多,以色列公司 Mobileye 佔據了市場份額的半壁江山。不過,龐琳勇表示單目攝像頭有一個缺點:無法直接測距離,首先它要判斷出來前面是輛車,然後根據車牌的大小來反推距離。這兩個過程都容易出問題,如假如它沒有識別出車就無法測距離。“而雙目不需要做判斷,可以直接算出來距離,減少失誤,所以雙目肯定是一個趨勢。”他說。
作為一個在底層創新深耕較久的人,龐琳勇已經有自己的一套創業看法。他認為,一些基礎的創新需要團隊做好多年,這些時間與精力鑄就了一個企業的壁壘。”就像我們做的這個事情,別人不是想做就能做,他也需要花很多年的時間。而且很有可能做的產品和客戶想要的差的很遠。”他表示,找準需求市場也是必備課程。
“機器人移動和無人車肯定需要知道自己在什麼地方,在走過程中別撞上東西,這是一個普遍的需求,而且這個需求是以前沒有的。所以做這個肯定不會錯。”龐琳勇一直對機器人自主導航的市場充滿了信心。小覓智慧,2014 年剛成立時時只有 5 個人的創始團隊,在冬天沒有暖氣的無錫哆嗦著程式設計,2016 年 1 月其推出的搭載小覓雙目的小覓機器人在 CES 上獲得高度關注,而後,其將戰略轉變為提供解決方案。這一路,小覓智慧的每個腳印都非常清晰。
目前,小覓智慧已經完成了來自樂搏資本的天使輪融資、以及真格基金的 Pre-A 輪和來自成識資本、申通董事長陳德軍、觸控科技、優客工場和中關村國際控股的 A 輪融資,累計融資近億元。
