Optimierung von Vorhersagbarkeit und Kosten in Interval-Markov-Entscheidungsprozessen durch Entropie-Regularisierung
Durch Entropie-Regularisierung lässt sich ein Kompromiss zwischen Optimalität und Vorhersagbarkeit in Interval-Markov-Entscheidungsprozessen finden.