Interpretierbare Roboterfortbewegung durch Destillation von Reinforcement-Learning-Richtlinien
Dieser Ansatz destilliert komplexe neuronale Netzwerk-Richtlinien, die durch Reinforcement-Learning trainiert wurden, in interpretierbare Formen wie Gradient Boosting Machines, Explainable Boosting Machines und symbolische Regression, um die Beobachtungs-Aktions-Zuordnung zu erklären und gleichzeitig die Leistung beizubehalten.