Heterogenes Multi-Agenten-Reinforcement-Learning für skalierbare Zusammenarbeit ohne Vorkenntnisse
Ein neuartiges MARL-Framework namens SHPPO, das Heterogenität in parameter-geteilte PPO-basierte MARL-Netzwerke integriert, um sowohl inter-individuelle als auch zeitliche Heterogenität zu erreichen und gleichzeitig eine skalierbare Zusammenarbeit zu ermöglichen.