BIEVR-LIO: Robust LiDAR-Inertial Odometry through Bump-Image-Enhanced Voxel Maps

Patrick Pfreundschuh, Turcan Tuna, Cedric Le Gentil, Roland Siegwart, Cesar Cadena, et al.

View Original ↗
AI 導讀 technology infrastructure 重要性 4/5

BIEVR-LIO 透過 0.05 公尺解析度的凹凸影像體素地圖,在 700 公尺極端無特徵隧道中達成穩定定位,並使運算點數減少四倍。

  • 放棄平面假設,採用 0.05 公尺解析度的高程影像記錄體素表面微距起伏。
  • 採用地圖引導採樣,在 MID 指標最高的 300 個體素保留高解析度點雲,節省四倍運算。
  • 採取鬆耦合架構,避免 IMU 殘差掩蓋光達細微幾何線索,增強無特徵環境的穩定度。

當移動機器人駛入筆直的地鐵隧道或廣袤的平坦草地時,缺乏幾何特徵往往導致主流的光達慣性里程計定位偏移甚至完全失效。蘇黎世聯邦理工學院(ETH Zurich)團隊提出的 BIEVR-LIO 系統,透過在空間體素地圖中嵌入解析度高達 0.05 公尺的「凹凸影像」,成功捕捉環境中肉眼難以察覺的微小表面起伏。這套演算法不僅在長達 700 公尺的極端無特徵隧道中維持精準定位,更透過雙解析度採樣機制,將高運算密度的點雲數量大幅降低近四倍。

傳統 LIO 系統在幾何匱乏環境的定位失效瓶頸

自駕車與移動載具領域高度依賴 LIO(LiDAR-Inertial Odometry,結合光達與慣性測量單元的里程計)來執行自我運動估計。儘管這項技術在多數室內外場景表現出色,一旦遭遇幾何資訊稀缺的環境,例如筆直的礦坑通道或缺乏參照物的寬闊地形,點雲對齊的空間約束條件便會急遽減少。多數現有系統為了解決這個衰退問題,往往需要引入額外的輔助感測器,這無可避免地增加了硬體與整合的複雜度。

另一派研究則嘗試利用光達的反射強度作為額外的對齊線索,但這類方法高度依賴能進行密集掃描的光達設備,無法相容於掃描模式不規則或點雲較為稀疏的平價感測器。研究團隊觀察到,這些被視為「無特徵」的現實環境,實際上很少是絕對平滑的,表面通常存在著微小的幾何變化。目前的 LIO 系統之所以無法利用這些細節,是因為其地圖表示法為了滿足即時運算需求,在降採樣與特徵提取的過程中,過度犧牲了空間解析度。

導入 0.05 公尺解析度的 BIEVR 凹凸影像地圖

為了解決微小特徵流失的問題,研究團隊開發了 BIEVR(Bump-Image-Enhanced Voxel Representation,凹凸影像增強體素表示法)。傳統的體素方法通常假設環境表面可以用單一平面或高斯分佈來近似,這會抹除表面細節;BIEVR 則是為每個 0.5 公尺寬的空間體素估算一個主導平面,並將該平面視為影像基準面,進一步儲存一個二維的高程影像。

在這個二維影像中,每個像素的空間解析度高達 0.05 公尺,專門記錄觀測到的點雲偏離主導平面的垂直距離(即凹凸程度)。這種設計不僅保留了尖銳的邊緣與不連續的微小起伏,同時具備常數時間(O(1))的記憶體查找優勢。為了整合多次掃描的資訊,系統會根據點雲距離光達的遠近分配權重,距離越近的點誤差越小,權重也越高。當地圖更新時,新點雲的高程資料會與既有影像進行加權平均,這讓演算法能直接利用未經降採樣的原始點雲建立高解析度表面。

結合 MID 指標的地圖感知雙解析度點雲採樣

擁有高解析度的地圖只是第一步,如果在輸入最新一幀光達點雲時,為了節省運算資源而採用均勻的粗略降採樣,依舊會錯失與地圖匹配的關鍵細微特徵。然而,全面使用高密度採樣又會導致運算量暴增。為此,團隊提出了一種由地圖資訊引導的兩階段雙解析度採樣策略,確保將運算資源集中在最具價值的區域。

系統首先為每個體素計算「平均影像距離(Mean Image Distance, MID)」。平坦表面的 MID 值極小,而含有豐富幾何細節(非平面)的體素則會產生較大的 MID 值。在進行掃描對齊前,系統會根據慣性測量單元(IMU)提供的初始姿態,篩選出 MID 分數最高的 300 個體素。在這些高資訊量的區域內,系統保留 0.1 公尺的高解析度點雲;而對於其他區域,則僅保留 0.5 公尺的低解析度點雲。實驗證明,這種做法不僅提升了對齊最佳化時的訊號雜訊比,更讓參與運算的總點數比全域高解析度採樣減少了約四倍。

排除慣性殘差干擾的鬆耦合狀態估計架構

在多感測器融合領域,緊耦合(Tightly-coupled)架構通常是主流,因為 IMU 可以在幾何特徵短暫消失時提供數學補償。但 BIEVR-LIO 刻意採用了鬆耦合(Loosely-coupled)設計。團隊發現在長距離的低結構環境中,緊耦合架構下的慣性殘差往往會主導最佳化過程,反而掩蓋了光達捕捉到的微弱幾何線索。因此,系統僅利用 IMU 進行點雲的畸變校正與提供初始姿態,實際的位姿估計完全由光達點雲與地圖的對齊運算決定。

在對齊運算上,系統採用類似光度誤差最小化的概念。演算法計算輸入點雲的高程與地圖像素值之間的誤差,其雅可比矩陣(Jacobian)不僅包含傳統的點到面法向量方向,還增加了兩個沿著影像平面的梯度方向。這兩個額外的維度能捕捉點雲在相鄰像素間移動時的高程變化,有效提升了在幾何特徵貧乏區域的最佳化穩定度。而 IMU 的偏差、速度與重力方向,則獨立於另一個 10 秒跨度的滑動視窗中進行最佳化,確保系統具備高靈敏度又不會失去整體物理一致性。

克服 700 公尺 GEODE 隧道與四足機器人實測

為了驗證系統的強健性,團隊在多個開源資料集上進行了全面評估,並對比了 KISS-ICPFAST-LIO2DLIO 等八種先進演算法。在極度缺乏特徵的 GEODE 資料集中,有一段長達 700 公尺的地下地鐵隧道(Shield1 序列),由於幾乎只有鐵軌與牆面微小的凹槽能提供縱向約束,多數對照組在此發生嚴重漂移或徹底發散。BIEVR-LIO 成為唯一能穩定追蹤且誤差最小的純幾何方法。

系統在 MARS-LVIG 資料集的高空無人機飛行(高度 80 公尺,點雲極度稀疏)中同樣展現了優異的穩定性。此外,團隊也在配備 Livox Mid-360 光達的四足機器人上測試了 GrandTour 序列,證明其能克服腿部運動帶來的震動。最值得一提的是,BIEVR 地圖能無縫銜接下游任務,演算法在機載電腦上只需約 1 毫秒,就能輸出機器人周圍 4x4 公尺的高程地圖,直接作為步伐規劃的依據,打通了從定位到控制的實用鏈條。

捨棄傳統平滑假設並保留微距幾何突變,結合動態採樣策略,是突破 LiDAR 在極限無特徵環境盲區的關鍵解法。

Abstract

Reliable odometry is essential for mobile robots as they increasingly enter more challenging environments, which often contain little information to constrain point cloud registration, resulting in degraded LiDAR-Inertial Odometry (LIO) accuracy or even divergence. To address this, we present BIEVR-LIO, a novel approach designed specifically to exploit subtle variations in the available geometry for improved robustness. We propose a high-resolution map representation that stores surfaces as compact voxel-wise oriented height images. This representation can directly be used for registration without the calculation of intermediate geometric primitives while still supporting efficient updates. Since informative geometry is often sparsely distributed in the environment, we further propose a map-informed point sampling strategy to focus registration on geometrically informative regions, improving robustness in uninformative environments while reducing computational cost compared to global high-resolution sampling. Experiments across multiple sensors, platforms, and environments demonstrates state-of-the-art performance in well-constrained scenes and substantial improvements in challenging scenarios where baseline methods diverge. Additionally, we demonstrate that the fine-grained geometry captured by BIEVR-LIO can be used for downstream tasks such as elevation mapping for robot locomotion.