Erkennung von Neuartigkeit in Reinforcement Learning mit Weltmodellen
Wir führen einen neuartigen Ansatz zur Erkennung von Neuartigkeit in Reinforcement Learning-Agenten ein, der auf den Abweichungen zwischen den vom Weltmodell vorhergesagten und den tatsächlich beobachteten Zuständen basiert. Unser Ansatz benötigt keine zusätzlichen Hyperparameter und kann Neuartigkeiten sowohl in visuellen als auch in funktionalen Aspekten der Umgebung erkennen.