Unabhängige Kommunikation in Multi-Agenten-Reinforcement-Learning
Agenten, die keine Parameter teilen, können immer noch erfolgreich Kommunikationsstrategien lernen, indem sie ein neues Lernschema verwenden, das die Probleme des Backpropagierens der Gradienten durch die Kommunikationsnetze löst.