Основні поняття
本稿では、動的な環境下でのマルチエージェント強化学習における通信効率とポリシー改善の両立を実現する、規制セグメント混合に基づく新しいアルゴリズム、RSM-MASACを提案する。
Анотація
RSM-MASAC: 動的環境下での通信効率の高いマルチエージェント強化学習
Yu, X., Li, R., Liang, C., & Zhao, Z. (2024). Communication-Efficient Soft Actor-Critic Policy Collaboration via Regulated Segment Mixture. IEEE Transactions on XXX, XX(X), XXX-XXX. (Partially accepted by IEEE Globecom 2023).
本研究は、動的な環境下で動作するマルチエージェント強化学習(MARL)システムにおいて、通信効率を向上させながら、堅牢なポリシー改善を保証することを目的とする。