Core Concepts
群衆密度に応じて動的に適応する局所通信メカニズムを備えたマルチエージェントパス探索手法を提案し、従来手法を大幅に上回るパフォーマンスを実現する。
Abstract
本論文では、群衆密度に応じて動的に適応する局所通信メカニズムを備えたマルチエージェントパス探索手法「CRAMP」を提案している。
まず、マルチエージェントパス探索問題をマルコフ決定過程として定式化し、深層強化学習を用いて各エージェントの局所ポリシーを学習する。その際、以下の工夫を行っている:
群衆密度に応じて報酬を動的に変更する群衆認知型の報酬関数を導入し、混雑領域の回避を促進する。
グラフニューラルネットワークを用いて近隣エージェントとの局所通信を行い、状況認識と意思決定の能力を高める。
段階的な難易度設定と強化学習の組み合わせによる効率的な学習手法を採用する。
実験の結果、提案手法「CRAMP」は、従来手法と比較して成功率、所要時間、衝突回数などの指標で大幅な性能向上を示した。特に、高密度の環境においても優れた結果を得ることができた。
本手法は、自律倉庫ロボット、ドローンスウォーム、自動運転車など、様々な分野での応用が期待できる。
Stats
エージェントの密度が0.75を超える領域に入った場合、-0.5の報酬を受ける。
エージェントの密度が0.75を下回る領域に移動した場合、+0.5の報酬を受ける。
Quotes
「群衆密度に応じて動的に適応する局所通信メカニズムを備えたマルチエージェントパス探索手法を提案し、従来手法を大幅に上回るパフォーマンスを実現する。」
「グラフニューラルネットワークを用いて近隣エージェントとの局所通信を行い、状況認識と意思決定の能力を高める。」