本論文では、ロボットに対する高レベルの言語指示を活用したマップフリーの制約付き屋外ナビゲーションについて提案している。
まず、音声をテキストに変換するモジュールを使って、ロボットに対する指示をテキスト化する。次に、大規模言語モデル(LLM)を使ってこの指示からランドマーク、好ましい地形、副詞といった重要な情報を抽出する。
抽出した情報を基に、言語駆動のセマンティックセグメンテーションモデルを使って、画像中の地形やランドマークを特定する。これにより、カメラパラメータを使って2Dの画像情報を3Dの移動面に変換し、MPC制御器によってロボットを目的の地形に誘導することができる。
この手法により、多様な環境への適応性が高まり、複雑な地形を高レベルの指示で効率的に航行できるようになる。実験では、仮想環境でのロングラン走行や、指定された地形や速度制約への対応など、良好な結果が得られている。
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문