Core Concepts
エコーステートネットワークを使用したマルチエージェント強化学習は、歩行者ダイナミクスにおいて有効であることが示された。
Abstract
歩行者のシミュレーションにおいて、マルチエージェント強化学習(MARL)が成功裏に検討された。
MARLエージェントが他のエージェントを避けながら前進する能力が調査された。
2つのタスクを考慮し、密度が高くない場合に学習が成功することが示唆された。
LSPIメソッドを採用したESNアルゴリズムは、深層学習よりも計算コストが低いことが示された。
Stats
マルチエージェント強化学習は密度に依存して成功することが示唆されました。
Quotes
"RL in an environment with several agents exist is referred to as multi-agent reinforcement learning (MARL), and has been studied intensively to realize the competition or cooperation between agents."
"This study proposed an RL algorithm using an echo-state network (ESN). ESN is a type of reservoir computing that uses recurrent neural networks (RNN) and trains only the output weight matrix."