Optimierung von Federated Reinforcement Learning in heterogenen MDPs durch konvergenzorientierte Stichprobennahme mit Screening
Die Autoren stellen ein neuartiges Aggregationsschema namens CAESAR vor, das konvergenzorientierte Stichprobennahme mit einem Screening-Mechanismus kombiniert, um die Lerneffizienz von Agenten in Federated Reinforcement Learning (FedRL) Szenarien mit heterogenen Markov-Entscheidungsprozessen (MDPs) zu verbessern.