Concepts de base
本文提出了一種名為VLM-GroNav的新型導航方法,該方法將視覺語言模型(VLM)與本體感知結合,以增強對地形可通行性的估計,從而改善機器人在複雜戶外環境中的導航性能。
Résumé
本文提出了一種名為VLM-GroNav的新型導航方法,該方法將視覺語言模型(VLM)與本體感知結合,以增強對地形可通行性的估計,從而改善機器人在複雜戶外環境中的導航性能。
VLM-GroNav的主要組件包括:
-
使用本體感知的可通行性估計模塊:
- 通過在上下文學習中融入本體感知數據,增強VLM對地形可通行性的預測,重點關注變形性(適用於腿式機器人)和滑動性(適用於輪式機器人)等物理特性。
- 這種動態微調VLM對不同地形的理解,顯著改善了全局和局部規劃,特別是在複雜或陌生的環境中。
-
新型自適應高層全局規劃器:
- 利用VLM引導航路點選擇和軌跡規劃,根據導航目標(如最小化軌跡長度或避免危險區域)選擇最佳航路點。
- 通過在航空影像上添加視覺標記,增強VLM對環境空間佈局和可能路徑的理解,實現動態軌跡重規劃。
-
實時自適應局部規劃器:
- 採用前沿區域方法,將本體反饋與緊湊型VLM相結合,動態調整機器人軌跡,優先選擇更可通行的路徑。
實驗結果表明,與現有方法相比,VLM-GroNav在導航成功率方面提高了50%,突出了將物理接地信息融入基於VLM的導航的好處。
Stats
在不同地形條件下,我們的方法VLM-GroNav的導航成功率顯著高於其他方法,最高可達100%。
與其他方法相比,VLM-GroNav的歸一化軌跡長度較短,表示更直接的路徑。
VLM-GroNav的IMU能量密度較低,表示更穩定的導航。