Die Arbeit präsentiert einen Ansatz zur effizienten Lösung hochdimensionaler partieller Integro-Differentialgleichungen (PIDEs) mit Sprüngen. Dazu wird ein Rahmenwerk auf Basis von Reinforcement Learning und Temporal Difference Learning entwickelt.
Zunächst wird eine Klasse von Lévy-Prozessen eingeführt, um die PIDE zu charakterisieren. Darauf aufbauend wird ein Reinforcement-Learning-Modell definiert, bei dem die Lösung der PIDE der Wertfunktion entspricht.
Zur Approximation der Lösung und der Nicht-Lokal-Terme werden neuronale Netzwerke verwendet. Der Verlust-Term setzt sich aus vier Komponenten zusammen: 1) Temporal Difference Error, 2) Endwertbedingung, 3) Gradient der Endwertbedingung und 4) Bedingung für die Nicht-Lokal-Terme.
Die Methode zeigt zwei Hauptvorteile: Zum einen ist der Rechenaufwand gering, da das Temporal Difference Learning eine inkrementelle Aktualisierung der Parameter ermöglicht. Zum anderen erreicht die Methode eine hohe Genauigkeit, mit relativen Fehlern in der Größenordnung von 10^-3 für 100-dimensionale Probleme und 10^-4 für eindimensionale Probleme mit reinen Sprüngen.
Die numerischen Experimente belegen die Robustheit der Methode gegenüber verschiedenen Parametern wie Anzahl der Trajektorien, Anzahl der Zeitintervalle, Sprungintensität und Sprungform. Außerdem wird die Leistungsfähigkeit in hochdimensionalen Szenarien demonstriert.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Liwei Lu,Hai... at arxiv.org 04-01-2024
https://arxiv.org/pdf/2307.02766.pdfDeeper Inquiries