Robuste Markov-Entscheidungsprozesse gehen über rabattierte Renditen hinaus, indem sie sich auf durchschnittliche und Blackwell-Optimalität konzentrieren.