Core Concepts
Die explizite Darstellung der Informationsstruktur ist entscheidend für die Analyse und Lösung von Verstärkungslernproblemen.
Abstract
Die Informationsstruktur beschreibt, wie Ereignisse im System zu verschiedenen Zeitpunkten sich gegenseitig beeinflussen.
Klassische Modelle des Verstärkungslernens nehmen eine einfache und regelmäßige Informationsstruktur an.
Reale sequenzielle Entscheidungsprobleme erfordern eine reiche und flexible Darstellung der Informationsstruktur.
Die explizite Darstellung der Informationsstruktur ermöglicht eine umfassendere Analyse und maßgeschneiderte Algorithmusgestaltung.
Die Komplexität der beobachtbaren Dynamik eines sequenziellen Entscheidungsproblems kann durch eine graphentheoretische Analyse der DAG-Repräsentation seiner Informationsstruktur charakterisiert werden.
Stats
In einem POMDP wird angenommen, dass es einen Markov'schen Zustand gibt, der von den Agenten beobachtet wird.
In einem MDP oder einem Markov-Team/Spiel wird angenommen, dass es eine Markov'sche Zustandsvariable gibt, die von den Agenten beobachtet wird.
Quotes
"Die explizite Darstellung der Informationsstruktur ist ein wichtiger Bestandteil der Analyse und Lösung von Verstärkungslernproblemen."