Die Autoren stellen ein neuartiges Aggregationsschema namens CAESAR vor, das konvergenzorientierte Stichprobennahme mit einem Screening-Mechanismus kombiniert, um die Lerneffizienz von Agenten in Federated Reinforcement Learning (FedRL) Szenarien mit heterogenen Markov-Entscheidungsprozessen (MDPs) zu verbessern.
The core message of this paper is to introduce the Convergence-AwarE SAmpling with scReening (CAESAR) aggregation scheme, which enhances the learning of individual agents across varied Markov Decision Processes (MDPs) in federated reinforcement learning settings characterized by environmental heterogeneity.