Die Autoren stellen ein neuartiges Aggregationsschema namens CAESAR vor, das konvergenzorientierte Stichprobennahme mit einem Screening-Mechanismus kombiniert, um die Lerneffizienz von Agenten in Federated Reinforcement Learning (FedRL) Szenarien mit heterogenen Markov-Entscheidungsprozessen (MDPs) zu verbessern.


coremsg

optimierung-von-federated-reinforcement-learning-in-heterogenen-mdps-durch-konvergenzorientierte-stichprobennahme-mit-screening


Optimierung von Federated Reinforcement Learning in heterogenen MDPs durch konvergenzorientierte Stichprobennahme mit Screening