オフラインデータセットのみを使用して、定常分布シフト正則化を組み込むことで、協調型マルチエージェント強化学習の性能を向上させる。
マルチエージェント強化学習(MARL)手法を用いて、人間の自然言語と整合性のある通信プロトコルを学習することで、人間-エージェントチームワークを効果的に実現する。
自己利益的な合理的エージェントが自発的にチームワークに参加する際の戦略と成果を理論的に予測する。
相対的過剰一般化は、協調的マルチエージェントタスクにおいて最適な共同行動の効用が非最適な共同行動の効用を下回る場合に発生する問題である。本研究では、カリキュラム学習を用いることで、この問題を効果的に克服する手法を提案する。
複数のエージェントが限られた通信範囲内で協調し、現象の発見数を最大化するための情報駆動型マルチエージェントパス探索アプローチ。
生成型エージェントアーキテクチャITCMA-Sを提案し、マルチエージェントの自発的な社会形成プロセスを検証した。
Multi-V2Xは、様々な自動運転車普及率に対応できる大規模なマルチモーダルデータセットであり、協調知覚の研究を大きく前進させる。
一般和マルコフ・ゲームにおいて、近似ナッシュ均衡に収束する分散型学習アルゴリズムを設計し、その理論的保証を示す。
イベントトリガー型制御を用いると、時間トリガー型制御と比べて平均トリガー率を低減できる一方で、一貫性を失う可能性がある。この問題は分散型の設定では特に顕著になる。
非定常環境下でのマルチエージェントシステムにおける均衡の学習に取り組む。既存の単一エージェントの非定常強化学習アルゴリズムを拡張することの困難さを指摘し、柔軟な黒箱アプローチを提案する。