複雑で不確定な環境においては、適応的な隊形制御が重要である。本研究では、グラフ学習と強化学習を組み合わせたバイレベルの学習フレームワークを提案し、さらにばね-ダンパモデルを強化学習の報酬関数に統合することで、ロボットチームが動的に隊形を調整しながら効果的に環境に適応できるようにした。