核心概念
複雑で不確定な環境においては、適応的な隊形制御が重要である。本研究では、グラフ学習と強化学習を組み合わせたバイレベルの学習フレームワークを提案し、さらにばね-ダンパモデルを強化学習の報酬関数に統合することで、ロボットチームが動的に隊形を調整しながら効果的に環境に適応できるようにした。
要約
本研究は、複雑で不確定な環境における多ロボット協調ナビゲーションの問題に取り組んでいる。従来の固定的な隊形制御手法では、狭い通路などの環境変化に適応することが困難であった。
本研究では、以下のアプローチを提案している:
- バイレベルの学習フレームワーク
- 高レベルではグラフ学習によるグループ全体の調整を行う
- 低レベルでは個々のロボットの強化学習による自律的なナビゲーションを実現する
これにより、個々のロボットの技能向上と全体の戦略維持のバランスを取ることができる。
- ばね-ダンパモデルの統合
- 強化学習の報酬関数にばね-ダンパモデルを組み込むことで、ロボットチームが動的に隊形の大きさを調整できるようにした
- ばねの力が隊形の形状を維持し、ダンパの力が過度の振動を抑制することで、柔軟かつ安定した隊形制御を実現する
実験では、円形、直線、くさび型の3つの隊形について、徐々に狭くなる環境を通過する課題を検証した。シミュレーションと実機実験の両方で良好な結果が得られ、提案手法の有効性が示された。
統計
ロボットチームの平均速度vと各ロボットの実際の中心からの距離r1, r2, ..., rnの平均rを用いて、隊形の整合性を評価する。
隣接するロボット間の距離s1, s2, ..., snを用いて、隊形の等角度分布を評価する。