VR 線下體驗館之痛——如何選擇最為合適的室內定位系統?

分類:數碼 時間:2016-10-07

編者按:本文轉載自轉載自微信公眾號 VR 價值論(vr-value),轉載時已獲得作者授權。

VR 線下體驗帶來的一大副產品就是,所有人都在說 “室內定位”!可真正系統了解過室內定位的人,太少了。本文將從實操的角度告訴你,七大定位方式,到底優劣何在,如何揚長避短。干貨滿滿,值得收藏細讀。

你將了解到:

  • 室內定位系統的現狀到底是什么樣?
  • 每一種定位方式的原理及優劣是什么?
  • 好的定位方案應當以怎樣的標準作為自己的目標?

本期由來自 VR 行業資深從業者王銳為你分享: 如何選擇最適合你的室內定位方式?

撰文:王銳,編輯:VR 價值論

現有的 VR 體驗館構建還缺少了最重要的一環,就是廉價而靈活準確的定位方案。本文將據此闡述一些已有方案的優劣:

缺失的一環

虛擬現實刮起的風暴如今已經愈演愈烈。

從形形色色的頭盔和眼鏡,到各種奇思妙想的交互設備,再到內容制作和建立體驗館的嘗試,越來越多的 VR 相關從業者和創業者都將 The Void,Zero Latency 等前輩作為自己下一步趕超的目標,發出了開發 VR 主題公園,或者 VR 主題體驗解決方案的宣言。

然而,從宏觀的角度來看, 整個行業也并非發展的一帆風順 :

VR 頭盔和眼鏡的水準參差不齊,VR 對系統配置的要求很高,相關設備隨身穿戴不易,而移動端設備的渲染則多半力有不逮;而針對體驗館的交互內容如何制作,互動方式如何設計,也有諸多不甚明朗的地方。

除此之外,VR 體驗館的構建卻還缺少了最重要的一環,就是廉價而靈活準確的定位方案。

這里所說的定位,就是確定體驗館中的參與者在場館中的絕對空間位置,并反饋到所有參與游戲的玩家和游戲服務器上,進而執行群體游戲所必需的各種游戲邏輯。

例如,當一位玩家靠近樹林的邊緣時,一頭蓄謀已久的餓狼會猛然撲出來;又比如多位玩家展開一場虛擬現實的真人 CS 大賽,互相射擊與開展戰術。

如果玩家在游戲場地內的位置無法得到有效識別,那么相應的樂趣和復雜度自然也就少了很多,也許只是來一場第一人稱的定點射擊游戲而已。

而定位的精度和速度也絕對不容忽視,20cm 的誤差也許就決定了射出的子彈是否能穿透虛擬敵人的胸膛,而定位本身帶來的延遲,同樣也會給虛擬現實玩家的現場感帶來巨大的影響,甚至成為 3D 暈動癥的幫兇。

然而,縱觀現在市面上形形色色的 VR 空間定位方案,卻并沒有哪家能夠提供足夠成熟穩定的技術實現,亦或者用巨大的成本以及靈活度的喪失作為代價,構建并不成功的 Demo 作品。

這樣的程度恐怕還遠遠不能稱之為解決方案,也遠遠無法滿足眾多體驗館從業者的胃口。那么,好的定位方案應當以怎樣的標準作為自己的目標?整個行業缺失的救世主又是否已經到來呢?本文將嘗試對此略加闡述。

(一)體感攝像頭

去年底,日本新宿的繁華地段進行了為期僅一天的 VR 體驗,通過頭戴 Gear VR 顯示一個虛擬雪山場景,同時搭建了實體吊橋道具,并通過風扇和冷空調來模擬寒冷的山巔環境。體驗者在吊橋上戰戰兢兢地前進,最終在場地的終點位置拿到屬于自己的獎品——來自經銷商的一杯熱飲。

這個體驗游戲的復雜度并不高,收效卻十分顯著。而其中不可或缺的一環就是判斷玩家在吊橋上行走的位置,然后對 Gear VR 中渲染的場景做出對應的處理。而在同一個宣傳視頻中,我們不難發現這樣一絲端倪:

很顯然這是一臺微軟的 Kinect2 體感設備,它可以通過 TOF(飛行時間)計算的方法,獲取傳感器射出光線遇到物體反射后的相位差,從而得到設備與實際場景之間的距離值,也就是深度值(depth) 。

由此形成的深度圖像不僅可以用來判斷物體相對體感設備的位置,還可以進一步得到物體的點云數據,甚至是角色的骨骼信息。

最重要的是, Kinect2 本身只是 XBox One 游戲機的可選外設,因此要買到它并且用來做 VR 內容的簡單空間定位,絕不會花費太多成本。

不過,物美價廉的對立面就是差強人意的性能參數,30fps 的刷新頻率必然讓人能夠比較明顯地感受到定位結果的延遲(雖然這種延遲相比頭盔的延遲來說,給人的影響更小),并且 Kinect 的視場角只有 60 度左右,最大識別范圍一般來說為 3-4 米。

在這個區域內可以識別最多 6 個人的位置信息,并且他們在 Kinect 的視場范圍內不能有太多的重疊,以免漏測(如上圖所示)。

顯然,這些苛刻的限制條件讓我們很難想象出一個比爬雪山喝咖啡更復雜的游戲了,不過至少這是一個不錯的開始。

(二)光學定位與圖像識別

有一則去年的新聞,在大多數 VR 從業者耳中應該不會陌生:澳大利亞的 Zero Latency 成為了全世界第一家虛擬現實游戲體驗中心,它占地 400 平方米左右,由 129 個 PS Eye 攝像頭組成,同時支持 6 名玩家同場進行游戲……

沒錯,這個體驗中心相比之前的 VR 應用,其最大的賣點就是可以在虛擬空間中自由行走。而 PS Move 設備(包括 PS Eye 攝像頭,以及裝備了標記光球的 Move 手柄)則是這一技術的核心所在。

如之前的游戲效果圖所示, 不同顏色的光球在 PS Eye 攝像頭中可以呈現出顯著不同于背景畫面的圖像,從而方便我們通過計算機視覺(CV)算法將它提取出來 。

當然,僅有一個 PS Eye 攝像頭的話,是無法得到玩家的三維空間信息。此時需要有不止一個攝像頭去捕捉玩家的光球在屏幕空間的位置,然后通過空中三角測量算法,取得玩家在世界坐標系當中的真實位置。

這里自然又帶出了兩個不小的問題 :

  1. 如何準確而穩定地從攝像頭畫面里判斷和區分不同的光球(標記點);
  2. 如何知道攝像頭本身在世界空間的位置和姿態,從而正確推算玩家的位置和姿態。

為了解決這里所述的第一個問題,已經足夠讓無數開發者絞盡腦汁、前赴后繼了。通過顏色來區分標記點的方案當然是可行的,不過如果攝像頭里出現了另一種類似顏色的干擾物呢?或者現場就是一片花花綠綠的環境怎么辦?

這種時候,誤識別恐怕是很難避免的。因此 ,一批光學動作捕捉供應商站了出來,他們在理念與問題看待方式的不同使他們進行了分支研究。

一種是深挖主動式光學,一種采取了被動式光學。

采用被動式光學的一方選擇采用紅外攝像頭作為識別的替代方案。

這里當然首推老牌的 OptiTrack,他們采用了幀速率大于 100Hz 的專業攝像頭,并且采用了全局快門系統,因而有效避免了高速運動的物體在畫面上出現運動模糊的現象。

它在攝像頭的周圍采用紅外 LED 進行補光,并且采用高反射率的材質來制作玩家佩戴的標記點。

因為紅外攝像頭本身已經屏蔽了大部分的可見光信息,因此標記點在畫面中就會顯得分外明顯。 除非有人用另外的紅外光源來進行干擾,否則幾乎不可能出現誤判斷的情形。

根據目前已知的一些信息,包括 The Void 主題公園,以及諾亦騰的 Project Alice,都是采用了 OptiTrack 的空間定位方案,這也無疑證明了這種方案的可靠性。

只是與之相對的,往往是高昂的成本(如下圖,一臺攝像頭的價格都是以數萬人民幣計算的,而構建一個規則空間起碼需要 4 臺這樣的攝像頭,以及軟件系統)。

不過,既然使用了不發光的標記球替代 PS Move 的光球方案(這樣的另一個好處是,不用考慮怎么給標記球供電的問題),那么如何區分標記球的 ID,進而區分游戲中的多個玩家呢?

方法也有多種,例如通過對反射率的調整,讓標記球在攝像頭畫面中顯示不同的亮度;或者采用不同的組合方式,讓一組光球在畫面中呈現出唯一的組合形態,如下圖所示:

而之前所說的第二個問題:如何知道攝像頭本身在世界空間的位置和姿態?

事實上是通過預先標定(calibration)的方式來完成的。體驗館的搭建者預先將每臺攝像機安裝到固定的位置,然后逐一觀察它們的畫面顯示。

通過已知位置姿態的一些標記物來推算每臺攝像機的位置姿態,并且保存下來。這一過程無疑是繁瑣而枯燥的,尤其當你需要動輒配置上百臺攝像機的時候。

而設置完成之后,如何避免攝像機被再次移動,或者因為場館結構問題而發生震動和偏移,這又是每一位開發者所不得不面對的設備維護難題。

不過,因為光學定位方法具有相當的準確度和穩定性,通過攝像頭參數的調校也可以達到很低的延遲,并且在理論上可以擴展到無限的空間, 因此它也確實成為了目前很多國內 VR 體驗館搭建者的首選。

然而,通過標記點來識別多名玩家還是具有很大的局限性,因為標記點不可能無限組合下去,兩組標記點靠得過近的話(例如背靠背作戰的兩位玩家),也很容易發生誤測或者無法識別的情形。

此外,過于復雜的場館環境也會讓標記點更容易被障礙物遮擋,從而發生漏測問題,因此目前我們所見的多家采用光學定位的體驗館,都是在一個空曠的規則房間內進行游戲的。

而另一方深挖主動式光學的人們,則利用 LED 光點的頻率與群組方式進行物體識別,使得每個 LED 光點都有自己獨特的 ID,從而解決顏色區分受干擾的問題。

國內的 VR 樂園 ARTA,采用的就是基于美國 NASA 的空間定位技術,配合主動式光點頻率與群組的方式,實現主動式動捕。

不過,這種技術明顯的優勢在于,其打破了被動式動捕的弊端,可以無限疊加,LED 光點越多動作捕獲越細膩,因為主動式不會存在被動式遮擋方面的尷尬問題,可以實現自由擁抱,跳舞,交易交互等高遮擋性動作。

又因其光點亮度,可以無視陽光,可實現室外與室內的雙重運用。這樣突破了空間限制,也可以任意指定控制器(如我們可以給馬桶搋子綁定光點,而在游戲內就可以變成騎士手握的圣劍)。

眾所周知,在同時間段內主動式光從 LED 光點發出直接被攝像頭接收,而被動式則以攝像頭紅外,傳輸到反光球,再由攝像頭接收,反饋到終端。這導致主動式的運算效率更快,且沒有大量無用信息干擾,這也是被動式獲取大量干擾信息后,終端需要猜想導致畫面或動作變形的主要原因。

當然世界上不存在絕對的無瑕疵,主動式的缺點為電池的續航,因為光點自發光所以電池續航能力在 6-8 小時,采用這種方式的樂園,其內容體驗單局游戲需要做好時間控制,以此來支撐全類體驗館與主題公園的使用。

(三)激光雷達

激光本身具有非常精確的測距能力,其測距精度可達毫米,一般常見的是日本 HOKUYO 北陽電機和德國 SICK 西克等專業領域的大廠所產的二維激光雷達。

二維的意思也就是這樣的激光雷達所發出的光是一個扇形平面,而各種用來做測繪用途或者建筑業用作三維重建的三維激光雷達,則是二維激光雷達又加了一個維度做旋轉,從而得到三維空間的結果。

激光雷達包括一個單束窄帶激光器和一個接收系統。

激光器產生并發射一束光脈沖,打在物體上再反射回來,最終被接收器接收。接收器準確地測量光脈沖從發射到被反射回的傳播時間,即 TOF(Time of Flight)。 因為光脈沖以光速傳播,所以接收器總會在下一個脈沖發出之前收到前一個被反射回的脈沖。

鑒于光速是已知的,傳播時間即可被轉換為對距離的測量。因為是以光速為尺子來測量的,所以激光雷達的精度一般都相當的高,在室內場合下用,誤差都在毫米級別。

二維激光雷達實際上也是由一維的單束激光器在一個旋轉底座上旋轉起來所形成的扇面,一個二維激光雷達可以以自已為中心,以幾十米為半徑畫扇面進行測量,所以如果在這個區域內有人活動的話,激光雷達就可以精確的知道一個人的位置并輸出給電腦使用。

當然,激光雷達通常也可以用做機器人研究的避障傳感器。

旋轉底座旋轉的快慢也是分很多規格的,因此激光雷達也會有掃描頻率區分,正常來說,幾十赫茲的掃描頻率足夠我們在 VR 當中做位置探測來用了。

但是激光雷達的工作原理對元器件要求高,通常又是工作在非常嚴苛的條件下,本身就要求防水防塵和數萬小時無故障的高可靠性,因此生產成本并不便宜。

此外,掃描頻率越高,探測距離越遠(也就是發射功率越大)的激光雷達,價格也就越貴。所以二維激光雷達的價格就已不菲(近萬元到數萬元不等),而用作測繪的機載三維激光雷達就不是一般人能問津的了(幾十萬至百萬)。

除了價格因素,激光雷達用作定位還存在一個主要的問題是: 因為從激光器發出的是一個扇形光,所以如果有一大堆運動物體互相擁擠著在一起的時候,互相會有遮蔽,后邊的物體處在前邊物體的 “陰影區” 當中,導致探測不到。

而且激光雷達只能測距,不能識別物體 ID,因此,就算不考慮價格因素,也比較適合單人情況下玩耍,如果想要群體的話,還是得采用其他方案。

(四)HTC Vive:Light House

這段時間里,HTC Vive 的發售成為了整個業界的一大新聞,而它所采用的一種不同于光學的定位方式也是人們津津樂道的地方。

HTC Vive 包括三大部分,本身布滿了紅外傳感器的頭盔和手柄,以及用作定位的 Light House。 游戲者預先將 Light House 布置到一個空屋子的兩個角落中,這兩個 Light House 相當于兩個固定的激光發射基站 ,如下圖所示:

Light House 的后蓋打開后,里面這樣的:

那片密密麻麻的 LED 就是用來同步的光束。兩個圓柱體則是旋轉的一字激光器,一個是 X 軸掃掠,另一個是 Y 軸掃掠。兩個激光器有固定的 180 度相位差,也就是說,A 亮的時候 B 不亮,B 亮的時候 A 不亮。

而手柄和頭盔上都有固定位置安裝的光敏傳感器,這套系統的具體工作流程分為三步:

  1. 同步 : LED 燈板整體亮一次,手柄和頭盔的傳感器一起被照射,作為同步信號。
  2. X 軸掃描 : 橫向的一字激光器照射手柄和頭盔上的光敏傳感器。
  3. Y 軸掃描 : 豎向的一字激光器照射手柄和頭盔上的光敏傳感器。

頭顯和控制器上安裝了很多光敏傳感器,在基站的 LED 閃光之后就會自動同步所有設備時間,然后激光開始掃描,此時光敏傳感器可以測量出 X 軸激光和 Y 軸激光分別到達傳感器的時間。

換句話說,激光掃掠過傳感器是有先后順序的,因此頭顯上的幾個傳感器感知信號的時間存在一個先后關系,于是各個傳感器相對于基站的 X 軸和 Y 軸角度也就已知了。

而頭顯和手柄上安裝傳感器的位置已經提前標定過,位置都是固定的。這樣根據各個傳感器的位置差,就可以計算出頭顯和手柄的位置和運動軌跡了。

Light House 最大優勢在于,它需要的計算量非常少。這就不像 CV 視覺系統那樣需要先成像,然后通過軟件將成像中的特征分辨出來,成像細節越豐富,需要的圖像處理能力就越高。

Light House 使用的僅僅是光敏器件,無需成像,也就不涉及到大量計算和圖像處理,避免了性能損耗和不穩定的可能。

另一方面來說,計算量大往往也就意味著延遲會更高,而且無法經由嵌入式處理器來完成運算。而 Light House 因為運算量小,因此嵌入式系統可以自己計算和處理,再直接將位置數據傳輸到 PC 上,節約了大量耗費在傳輸和處理上的延時。

不過,雖然 Light House 是迄今為止體驗最好的 VR 交互定位設備,但是因為激光對人眼安全照射功率的限制等問題,它能夠覆蓋的距離比較有限,大概也就是 5M* 5M 見方的一個區域,并且不能有過多的遮擋物導致接收不到信號。

并且這種設備的安裝調試還是比較繁瑣的,對于一般用戶來說可能還是比較困難。

(五)RTKGPS

實時差分 GPS 技術至少有兩個部分組成:在基站上安置接收機,對所有可見的 GPS 衛星進行連續觀測,并將觀測數據通過傳輸設備(比如數傳電臺,Wi-Fi,以及公用 3G/4G 通信網等等),實時地發送給用戶觀測站(流動站)。

而在用戶觀測站上,同樣通過 GPS 接收機接收 GPS 衛星信號,同時還通過無線電接收設備,接收基站傳輸的觀測數據,然后通過相對定位實時地解算用戶三維坐標,其動態定位精度可達 1cm-2cm。

這一技術不僅可以用作測繪,也可以用于軍事用途。它的高精度特性可以用于聯合收割機等大型農用機械的精確導航,從而在大機械生產和精耕細作之間達到完美結合;而在國內,一個相當廣泛的民用場景則是駕校考桿……

在 RTKGPS 出現之前,測繪行業為了獲得一個精確到厘米的坐標,需要用普通 GPS 設備接收數據然后進行大量的離線計算。

而 RTKGPS 的出現大大發展了許多新應用場景,例如無人機。RTKGPS 原本屬于專業領域,使用者寥寥且售價也非常高,不過近些年來已經有越來越多從業者將這項技術變得更親民,例如下圖這塊開源 RTKGPS 套件:

不過,RTKGPS 畢竟是 GPS,必須在戶外才能夠使用。這對于通常計劃設置在室內或者大商場中心的 VR 體驗館來說,無疑是一大不利的消息。

不過室外的極重度 VR 體驗也絕非沒有先例,例如下文鏈接中的視頻曾一度紅遍各大媒體和朋友圈(但是真的是高度危險,絕不要自行嘗試)—— 《戴上 VR 頭盔開賽車,炫酷到沒朋友》

這原本是某汽車大廠牌和某潤滑油一起搞的一次公關活動,賽手帶上 OculusVR 頭盔,同時車上裝載了高性能電腦,從而完全體驗到在虛擬空間當中漂移的樂趣。

而這個冒險活動之所以能夠成功,其中一大原因就是采用了 RTKGPS 來完成定位,這樣才能比較精確的知道車與駕駛員的位置,并且安排對應的虛擬內容呈現(以及避免車手樂極生悲跌出場外)。

(六)UWB

UWB 定位技術屬于無線定位技術的一種,這一技術(Ultra Wide band)也被稱為 “超寬帶” 定位,它是一種利用脈沖信號進行高速無線數據傳輸的短程通信技術,而非一般無線通信系統所廣泛采用的載波方式。

UWB 定位原理其實也很簡單,就是利用信標發出的脈沖到達基站的飛行時間來解算位置,沒錯,還是我們所熟悉的名字,TOF(Time of Flight)。

不要忘了無線電也是基于光速傳播的,因此它的探測精度從理論上可以做到很高。

UWB 最初的定義是來自于 60 年代興起的脈沖通信技術。UWB 技術的脈沖長度通常在亞納秒量級,而信號帶寬可以達到數千兆赫茲(UWB 限制在 3.1 – 10.6 GHz),這項技術在 1989 年被美國國防部命名為超寬帶技術。其特點是大帶寬,無載波,低功率。

正因為帶寬超大,因此 UWB 技術的穿透性比較好。

相比 Wi-Fi 等技術來說,無線電的多徑效應(因為高頻信號都是直線傳播的,所以會因為建筑的遮擋等來回彈跳分成幾路,難以判斷)要弱得多,所以這一定位方案精度往往要比傳統的基于 Wi-Fi 的 Room-Level 方案(即判斷用戶在室內的哪個房間)高出不少。

現在成熟的 UWB 定位方案系統甚至可以做到幾十厘米,也有個別方案商號稱能有 2-5 厘米的精度級別,但是實際在各種不同空間的建筑物室內場合部署的時候,基本上還是達不到這個精度。

畢竟不可能所有的場地都是一個空曠且沒有任何遮擋,也沒有更多人參與的大屋子。

不要忘記這項技術本身的核心還是通信鏈路,因此各種設備的通信干擾同時也產生了。

畢竟 UWB 本身還是一種無線電技術,它所覆蓋頻段內所有的無線通信都會對它有所干擾,并且,盡管它的穿墻性能比別的無線技術更好,但是仍會有較大衰減。而且 UWB 的標準是限制發射功率的,所以現在絕大多數方案都是在 10 米左右有效,如果是室內較大場館的話,可能還要布設大量的通訊基站。

因此,目前如果采用 UWB 獨立定位的方案,恐怕還是達不到重度 VR 體驗所需要的定位精度和距離,不過如果可以與其他方式進行數據融合的話,也許有希望解決這一問題。

比如德國著名的 Fraunhofer 研究中心,早就有一種” 黑科技” 產品叫做 RedFir:

在球員雙腳的球鞋中安裝設備,以及球內放置好設備,同時在整個場地里布設大量的采集基站之后,整個球場就變成了一個高科技虛擬演播室,可以在進行比賽轉播的過程中隨時進行數據采集和分析,進行可視化的工作。

這樣的好事當然也有希望用到 VR 體驗當中,只是為了無線傳輸本身的那些關鍵問題,恐怕依然要開發者們付出不小的代價。

(七)當紅炸子雞:SLAM

SLAM 的英文全稱是:Simultaneous Localization and Mapping,即時定位與地圖構建。

簡而言之,對于空間內的一個機器人(或者無人機),如果它處在一個完全未知的環境里(比如古墓探險),那么它就可以一面沿著墓道往里走,一面用攝像頭或者激光雷達來創建這個墓道的數字信息拷貝(也就是構建地圖),這樣過一會兒就可以使用剛才創建的地圖數據給自己導航使用了。

哦,一些非常高檔的掃地機器人,也號稱用到了這項技術。

在電影《普羅米修斯》中有這樣一個場景,一個擁有激光探測信息能力的無人機(球)被扔出去后,就開始自主獲取空間信息。這是一個典型的 SLAM 應用場景。

實際上,從學術定義上來說,機器人在完全未知的環境中從一個未知位置開始移動,然后在移動過程中根據位置估算和自身傳感器的數據進行不斷地定位和修正,同時建造增量式的地圖,這就是 SLAM 方法的基本過程了。

當然,這種方法不一定只服務于機器人,如果是人背負了便攜計算設備(或者手機),那么通過 SLAM 同樣能在未知環境里創造地圖并給自己定位,這就是我們在 VR 場景中迫切需要的功能。

SLAM 算法的數據源是多種多樣的,比如用激光雷達掃描的點云數據,也有雙目攝像頭利用 RGB 圖像和立體視覺來生成,或者就是直接使用 Kinect 這樣的 RGBD(可見光 深度)方案;而實驗室級別中甚至也可以見到基于單攝像頭和 RGB 彩色圖像或者灰度圖像來做 SLAM 的算法論文。

從另一個角度來說,如果期望實現基于三維空間的識別技術(而不是傳統的二維碼或者圖片),那么就意味著必須更好更快地應用 SLAM 類的方法,而也是各大 AR 軟件和算法開發者(例如 Metaio,不過已經被蘋果收購)一直在努力實現的目標。

因為 SLAM 一方面能夠給出一個比較精準的空間位置,同時還能做為環境三維特征獲取和三維重建的必要手段,進而解決了顯示設備里實際場景和虛擬畫面疊加時,相互遮擋關系的問題,這樣的 AR 場景在將來也許是廣泛應用的,也許也是隨身可穿戴的一種剛性需求。

如今,SLAM 已經被廣泛地應用在 VR/AR 的設備上了,比如微軟的 HoloLens 就是典型的 RGBD SLAM 方案。而 Google 的 Project Tange 手機,以及 Intel 的 RealSense 都屬于 RGB-D SLAM 的設備范疇。

即使是一直沒有多少人見過實物的 “黑科技” 公司 Magic Leap,恐怕也不可能不采用 SLAM 來做為空間定位和虛實遮擋關系判斷的基石。

而 SLAM 在高端商用市場上,其實早就有很成熟的案例。例如虛擬演播室攝像機系統 NCAM,它無需傳統的電控云臺,可以直接架在斯坦尼康穩定器上到處拍攝。得到的相機位置和姿態結果則會實時地反映到內容制作工具當中,從而實現一部動畫片或者特效大片當中重要的攝像機走位環節。

當然了,SLAM 技術絕不是沒缺點。

首先它依然是基于視覺的識別,信號的采集/ 傳輸 / 處理過程相對其他技術手段來看,延時情況往往還是難以忽略,而這恰恰是 VR 體驗里最不能接受的一點。

另外,SLAM 對現階段的移動設備來說,計算壓力仍然太大,Project Tango 手機和 HoloLens 眼鏡為此增加了一塊或者多塊協處理器,這樣自然又帶來了電源管理和過熱等各種問題,傳聞中卡馬克也在為未來的 OculusVR 和 GearVR 頭盔尋求基于 SLAM 的定位方案,它是否能成為未來 VR 世界主流定位方式,目前還是個未知數。

另辟蹊徑,全向跑步機

以上所有的空間定位方案,都是基于同一個大前提,即玩家可以按照自己的意志在場地中自由行走,其行走范圍受到場地本身的限制。

如果我們的體驗目標是一款在倉庫密室里大戰僵尸,或者在街口構筑工事迎擊強敵的 VR 游戲,那么這樣的方案顯然總有用武之地;但是如果我們是以一款《GTA5》一樣的超級大空間作為目標,或者是可以無限和探索下去的沙盒游戲,那么再大的場地恐怕也不夠玩家折騰……

而且場地越龐大,結構和形狀越復雜,對應的定位設施安裝和維護成本就越高,要保持一個穩定的定位算法和精度也就越困難。

幸好,總有人能夠另辟蹊徑,比如在人們每天健身常用的跑步機當中,加入除了速度控制之外的方向控制因素,就成了所謂的全向跑步機

(Omni-directional treadmill):

不過設計一款全向跑步機可不是去淘寶選一款帶觸摸屏和 MP3 功能的跑步機那么簡單的事情,這里有兩個巨大的問題需要開發者們去思考解決:

  1. 如何識別玩家在跑步機上運動的速度和方向;
  2. 如何把跑動的玩家限制在設備中心,或者在他無察覺的前提下把他 “拽回” 設備中心?

上圖的 Omnideck 就是一套比較早推出的解決方案,它采用了一組以玩家為重心的徑向運動的傳送帶。當玩家走到任意一條傳送帶上面時,傳感器就會感知到玩家的運動方向和速度,然后帶動皮帶將玩家送回到中心。

不難想象,圖中設備的精度主要取決于這些徑向傳送帶的數量。而一旦增加傳送帶的數量,則會帶來更為沉重的維護成本,傳感器精度問題,以及自身重量。

況且在如此巨大的空間內只能容納一個人游戲,這從營收角度上來看可能也是入不敷出的。因此,很多專注于 VR 行走體驗的公司隨即推出了一個看起來更為合理的方案,例如下圖中的 Virtuix Omni:

Omni 跑步機本身可以看作是一個炒菜用的不粘鍋鍋底(事實上它的材質確實也就是不粘鍋的材質),它的底盤被設計成一個表面凹陷的圓形曲面,并且由很多細小凹槽的光滑徑向跑道組成。

上方是一個可調節支架,起到保護玩家和識別下蹲 / 跳起動作的功能,總重量約為 50 公斤,并且用戶需要穿上特制的鞋子才能夠在 Omni 的跑道上運動——更準確地說,是在跑道上滑動。

這一設計比前者更為輕巧靈便,其關鍵就在于這種 “腳部在鍋底滑動而無法離開中心” 的特點,而凹槽中遍布的傳感器系統則會負責隨時測量用戶運動的方向和速率,從而模擬出玩家在虛擬空間的行進過程。

這一方案從原理上看起來無懈可擊,只是穿戴起來比較繁瑣,推向家用市場恐怕還有距離。然而,從實際使用者反饋來看,“腳底滑步” 的運動方式顯然不會讓他們感到舒適。甚至可能是一首兒歌中的感覺:

小老鼠,上燈臺,偷油吃……

那么有沒有那種不那么笨重,靈敏而準確,跑起來又不會讓玩家感到不適的方案呢?也許會有:

Infinadeck 全向跑步機自誕生之日起就吸引了諸多媒體和行業人士的關注,它的基本構想其實并沒有非常復雜的地方:采用電機帶動皮帶輪的方式,使用一整條沿 Y 軸運動的大皮帶輪,帶動多條沿 X 軸運動的小皮帶輪,這樣玩家在兩個軸向上的運動都可以被識別和記錄下來。

而玩家一旦離開了跑步機中心位置,系統就會通過視覺識別或者其它的識別方式發覺玩家的偏移方向和距離,并且啟動電機將玩家送回原處。

當然,這樣的設計同樣有兩個不小的難關要闖。

首先是負重問題,如此多的電機和皮帶輪被安置在一臺設備之上,自身的承重壓力恐怕是相當不小,整個非機械結構也不得不用足原料,打造鋼鐵之軀;總體估算下來,這樣的設備難免有上噸的重量,真的搬到家里恐怕只會讓樓下的鄰居如坐針氈。

其次是玩家的運動感受與設備尺寸的關系,如果設備本身過小,皮帶輪周長也就很小,產生的摩擦力也就不同——由此很容易帶給玩家一種明顯 “被拽回原地” 的感受;而設備過大雖然能夠讓 “回原位” 的過程變得平滑,卻無疑進一步增加了設備體積和重量,讓家用級使用成本變得更為難以接受。

Infinadeck 一直在聲稱要構筑廉價和方便的全向跑步機系統,而他們遲遲沒有放出更新的消息,也許也正在受困于這些結構和選材上的難題吧。

各方案優劣列表

我們簡單地總結一下之前提到的各種定位方案的優劣,如下表所示:

結論似乎暫時還很讓人沮喪,沒有哪個方案可以說同時解決了成本、游戲人數、延遲時間、抗干擾性、以及空間限制這幾大問題。

換句話說,雖然筆者歷經千辛萬苦和各種求知求助,總算集齊了七大武器加上一個額外的 Bouns(跑步機),卻依然無法達成那個一開始就存于心中的愿望:VR 虛擬空間行走的體驗,難道就真的是一個遙不可及的目標?

幸好,我們看到有足夠多的從業者已經為這個目標而開始努力。

筆者體驗過上海青瞳的光學定位方案,其低延遲和準確性已經做到了可用的級別,而更低成本的產品研發想必也是這個團隊下一步的目標;諾亦騰據傳也不滿足于目前系統關鍵部件的高成本和受制于人,開始研究自己的光學定位系統;The Void 更是秘密收了一個專精于 UWB 定位的團隊,打算把自己的主題公園定位方案更加精進。

讓建造和維護成本更可控,讓多人同場游戲不再是關鍵難題,讓你的游戲者不要變得舉步維艱,期待未來出現更多接近實際需求的定位方式。

題圖來源: youtube


Tags: 虛擬現實

文章來源:http://www.ifanr.com/725816


ads
ads

相關文章
ads

相關文章

ad