Probabilistische Modellprüfung von stochastischen Reinforcement-Learning-Richtlinien
Wir stellen eine Methode zur Verifizierung stochastischer Reinforcement-Learning-Richtlinien vor, die unabhängig vom verwendeten Reinforcement-Learning-Algorithmus ist und nur den aktuellen Zustand und die Aktion berücksichtigt.