Core Concepts
タスク固有のコミュニケーション戦略の無駄を排除し、環境内のすべてのタスクで共有可能なコミュニケーション戦略を導入する。
Abstract
マルチエージェント強化学習(MARL)における通信方法は、ほとんどがタスク固有であり、新しい通信戦略を各個別のタスクごとにトレーニングしている。
提案された方法は、自己監督学習を用いて任意の環境内のすべてのタスクに適用可能な通信戦略を導入する。
事前トレーニングされた通信戦略は、新しいタスクへのシームレスな適応を実現し、トレーニング中に見られなかったより多くのエージェントへの拡張をサポートする。
実験結果は、提案手法が未知のタスクで特定目的の通信戦略よりも優れており、訓練時よりも多くのエージェントでも性能が低下しないことを示している。
Stats
我々は提案手法が他よりも優れた報酬を生み出すことを示す実験結果から得られるデータや数値はありません。
Quotes
"我々は提案した方法が未知のタスクで一貫してエージェントが通信を活用できることを示しています。"
"この方法は実世界で協力ロボットが共有環境でさまざまなタスクに従事する際に役立ちます。"