Der Artikel untersucht eine Reihe von Optimierungsproblemen für Markov-Entscheidungsprozesse (MDPs) mit einem Zähler und ganzzahlig gewichteten MDPs mit endlichem Zustandsraum. Dazu gehören:
Obwohl für einige Spezialfälle algorithmische Ergebnisse bekannt sind, ist der Entscheidbarkeits-Status der Entscheidungsversionen dieser Probleme im Allgemeinen unbekannt.
Der Artikel zeigt, dass diese Optimierungsprobleme inhärent mathematisch schwierig sind, indem er polynomielle Reduktionen vom Positivitätsproblem für lineare Rekursionsfolgen präsentiert. Dieses Problem ist ein bekanntes zahlentheoretisches Problem, dessen Entscheidbarkeits-Status seit Jahrzehnten offen ist. Eine Entscheidbarkeit des Positivitätsproblems hätte weitreichende Konsequenzen in der analytischen Zahlentheorie. Daher zeigen die Reduktionen, dass eine algorithmische Lösung für eines der untersuchten Probleme ohne einen großen Durchbruch in der analytischen Zahlentheorie nicht möglich ist.
Die Reduktionen basieren auf der Konstruktion von MDP-Gadgets, die die Anfangswerte und linearen Rekursionsbeziehungen von linearen Rekursionsfolgen codieren. Diese Gadgets können flexibel angepasst werden, um verschiedene Positivitäts-Härte-Ergebnisse zu beweisen.
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor