핵심 개념
Dieser Artikel zeigt, dass eine Reihe von Optimierungsproblemen für Markov-Entscheidungsprozesse (MDPs) mit einem Zähler und ganzzahlig gewichteten MDPs mit endlichem Zustandsraum inhärent mathematisch schwierig sind. Dies wird durch polynomielle Reduktionen vom Positivitätsproblem für lineare Rekursionsfolgen bewiesen. Die Entscheidbarkeit des Positivitätsproblems hätte weitreichende Konsequenzen in der analytischen Zahlentheorie, sodass eine algorithmische Lösung für die untersuchten Probleme ohne einen großen Durchbruch in diesem Gebiet nicht möglich ist.
초록
Der Artikel untersucht eine Reihe von Optimierungsproblemen für Markov-Entscheidungsprozesse (MDPs) mit einem Zähler und ganzzahlig gewichteten MDPs mit endlichem Zustandsraum. Dazu gehören:
Terminations-Wahrscheinlichkeiten und erwartete Terminierungszeiten für Ein-Zähler-MDPs
Erfüllungs-Wahrscheinlichkeiten von Energie-Zielen, bedingte und partielle Erwartungen
Erfüllungs-Wahrscheinlichkeiten von Beschränkungen auf das gesamte akkumulierte Gewicht
Berechnung von Quantilen für das akkumulierte Gewicht
Berechnung des bedingten Wert-bei-Risiko für akkumulierte Gewichte
Obwohl für einige Spezialfälle algorithmische Ergebnisse bekannt sind, ist der Entscheidbarkeits-Status der Entscheidungsversionen dieser Probleme im Allgemeinen unbekannt.
Der Artikel zeigt, dass diese Optimierungsprobleme inhärent mathematisch schwierig sind, indem er polynomielle Reduktionen vom Positivitätsproblem für lineare Rekursionsfolgen präsentiert. Dieses Problem ist ein bekanntes zahlentheoretisches Problem, dessen Entscheidbarkeits-Status seit Jahrzehnten offen ist. Eine Entscheidbarkeit des Positivitätsproblems hätte weitreichende Konsequenzen in der analytischen Zahlentheorie. Daher zeigen die Reduktionen, dass eine algorithmische Lösung für eines der untersuchten Probleme ohne einen großen Durchbruch in der analytischen Zahlentheorie nicht möglich ist.
Die Reduktionen basieren auf der Konstruktion von MDP-Gadgets, die die Anfangswerte und linearen Rekursionsbeziehungen von linearen Rekursionsfolgen codieren. Diese Gadgets können flexibel angepasst werden, um verschiedene Positivitäts-Härte-Ergebnisse zu beweisen.
통계
Keine relevanten Statistiken oder Zahlen im Artikel enthalten.
인용구
Keine markanten Zitate im Artikel enthalten.