TopoNavは、未知の環境でのロボットの自律ナビゲーションを実現するための新しいアプローチです。主な特徴は以下の通りです:
アクティブマッピング: TopoNavは、ロボットの観測から動的にトポロジカルマップを構築・更新します。このマップは、ランドマーク、オブジェクト、木などの特徴を表すノードと、それらの接続性を表すエッジから成ります。
階層的強化学習: TopoNavは、メタコントローラーとサブコントローラーからなる2層の階層的な強化学習アーキテクチャを採用しています。メタコントローラーはトポロジカルマップからサブゴールを選択し、サブコントローラーはそのサブゴールに到達するための低レベルの行動を生成します。
内発的動機付け: TopoNavは、外部報酬が疎な環境でも効率的に探索と学習を行えるよう、内発的報酬メカニズムを導入しています。これにより、未知の領域の探索や新しい接続の発見を促進します。
TopoNavは、シミュレーション環境と実世界の屋外環境で評価されました。その結果、既存手法と比較して、探索範囲が7-20%増加、ナビゲーション成功率が9-19%向上、ナビゲーション時間が15-36%短縮されることが示されました。これらの成果は、TopoNavが複雑な環境でも優れたナビゲーション性能を発揮することを証明しています。
翻譯成其他語言
從原文內容
arxiv.org
深入探究