In dieser Arbeit wird ein neuartiger Ansatz zur Erkennung von Neuartigkeit in Reinforcement Learning-Agenten vorgestellt. Der Ansatz nutzt die Abweichungen zwischen den vom Weltmodell des Agenten vorhergesagten Zuständen und den tatsächlich beobachteten Zuständen, um Neuartigkeiten zu erkennen.
Der Kern des Ansatzes ist eine Schwellenwertberechnung, die auf der Bayesschen Überraschungstheorie basiert und keine zusätzlichen Hyperparameter erfordert. Die Idee ist, dass wenn der Agent in einer stationären Umgebung trainiert wird, die Abweichung zwischen der vom Weltmodell vorhergesagten Zustandsverteilung unter Verwendung des aktuellen Zustands und der Verteilung unter Verwendung nur des Historienzustands kleiner sein sollte als die Abweichung zwischen der Verteilung unter Verwendung des Historienzustands und der Verteilung ohne jegliche Eingaben. Wenn diese Beziehung gestört wird, deutet dies auf eine Neuartigkeit hin.
Die Autoren evaluieren ihren Ansatz in einer Reihe von angepassten MiniGrid-Umgebungen, die verschiedene Arten von visuellen und funktionalen Neuartigkeiten beinhalten. Der Ansatz zeigt im Vergleich zu etablierten Methoden wie RIQN und CMTRE eine deutlich geringere durchschnittliche Verzögerung bei der Erkennung von Neuartigkeiten bei gleichzeitig sehr niedrigen Fehlalarmraten.
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問