核心概念
未知の動的環境におけるロボットの自律的なナビゲーションを実現するために、リアルタイムでセマンティックシーングラフを構築・更新し、大規模言語モデルを用いて文脈に応じた高レベルプランニングを行うフレームワークを提案する。
要約
OrionNav: 文脈に応じた大規模言語モデルとオープンボキャブラリー意味セマンティックシーングラフを用いたロボット自律性のためのオンラインプランニング
書誌情報
Devarakonda, V. N., Goswami, R. G., Kaypak, A. U., Patel, N., Khorrambakht, R., Krishnamurthy, P., & Khorrami, F. (2024). OrionNav: Online Planning for Robot Autonomy with Context-Aware LLM and Open-Vocabulary Semantic Scene Graphs. arXiv preprint arXiv:2410.06239.
研究目的
本研究は、未知の動的な環境において、ロボットが自然言語による指示を理解し、自律的にタスクを実行するためのフレームワークを提案することを目的とする。
手法
本研究では、オープンボキャブラリーセマンティックセグメンテーションとSLAMを統合し、ロボットの周囲環境のセマンティックオブジェクトマップをリアルタイムで生成・更新する手法を提案する。このマップは、階層的なシーングラフを構築するために使用され、大規模言語モデル(LLM)はこのグラフを用いて、文脈に応じた高レベルプランを生成する。さらに、安全な動作プリミティブと、障害物回避のための制御バリア関数(CBF)コントローラを用いた低レベルモーションプランナーを統合することで、安全で効率的なナビゲーションを実現する。
主な結果
提案手法を、複数の部屋と廊下を含むオフィス環境において、Unitree Go2四足歩行ロボットを用いて評価した。その結果、提案手法は、オブジェクト検索タスクと部屋ナビゲーションタスクの両方において、高い成功率を達成した。
結論
本研究で提案するフレームワークは、未知の動的環境において、ロボットが人間の指示を理解し、自律的にタスクを実行するための効果的なアプローチであることが示された。
意義
本研究は、ロボットの自律性と人間との自然なインタラクションを実現するための重要な基盤となる。特に、動的な環境変化への適応能力は、現実世界におけるロボットの応用範囲を大きく広げる可能性を秘めている。
限界と今後の研究
本研究では、主に屋内環境におけるナビゲーションタスクに焦点を当てている。今後の研究では、屋外環境やより複雑なタスクへの拡張が期待される。また、LLMの推論過程の解釈可能性を高めることも重要な課題である。
統計
全体で96回の試行を行い、85回成功し、成功率は88%を超えた。
SLAMマップのエラーによる失敗が2件、オドメトリエラーによる失敗が1件発生した。
エクスプロレーションアルゴリズムが、ロボットをクエリ対象オブジェクトを含む場所に誘導できなかったケースが3件あった。
セマンティックセグメンテーションのエラー(オブジェクトが検出されなかった、または誤分類された)が4件発生した。
CBFベースのナビゲーションシステムの障害により、ロボットが障害物に衝突したケースが1件あった。
LLMプランニングやシーングラフ生成に関連する障害は発生しなかった。
短距離オブジェクト検索タスクの成功率は約92%であった。
長距離オブジェクト検索タスクの成功率は88%であった。
部屋ナビゲーションタスクでは12回の試行を行い、失敗は3件のみであった。
フロンティアサーチを用いたベースライン手法は、9回の試行のうち8回失敗し、成功は1回のみであった。
オブジェクトマップサーチを用いたベースライン手法の成功率は約56%であった。