Grenzen der Mehrstufigen Inversen Methode zur Erlernung kontrollierbarer latenter Zustände
Die Mehrstufige Inverse Methode (AC-State) ist nicht immer ausreichend, um eine korrekte kontrollierbare latente Zustandsrepräsentation in Ex-BMDP-Umgebungen zu erlernen. Eine Kombination aus Mehrstufiger Inverser Vorhersage und einem latenten Vorwärtsmodell (ACDF) ist notwendig, um dies in einer breiten Klasse von Ex-BMDPs zu garantieren.