Core Concepts
Verschiedene Methoden zur Schätzung von Vorhersageintervallen in Regressionsaufgaben, wie Bayes-Methoden, Ensemble-Methoden, direkte Intervallschätzung und konforme Vorhersage, werden konzeptionell und experimentell untersucht. Die Ergebnisse auf Benchmark-Datensätzen zeigen große Leistungsschwankungen von einem Datensatz zum anderen, die auf die Verletzung bestimmter Annahmen zurückzuführen sind, die für einige Methodenklassen charakteristisch sind. Es wird gezeigt, wie konforme Vorhersage als allgemeines Kalibrierungsverfahren für Methoden verwendet werden kann, die ohne Kalibrierungsschritt schlechte Ergebnisse liefern.
Abstract
Der Artikel gibt einen Überblick über vier allgemeine Klassen von Methoden zur Erzeugung von Vorhersageintervallen in Regressionsaufgaben: Bayes-Methoden, Ensemble-Methoden, direkte Intervallschätzung und konforme Vorhersage.
Bayes-Methoden modellieren die bedingte Verteilung der Zielgröße und verwenden Bayes'sche Inferenz, um Vorhersageintervalle zu erhalten. Beispiele sind Gauß-Prozesse und Bayes'sche neuronale Netze. Diese Methoden haben den Vorteil, dass sie theoretische Garantien für die Gültigkeit der Intervalle liefern können, sind aber oft rechenintensiv.
Ensemble-Methoden kombinieren mehrere Basismodelle, um robustere Vorhersagen und Unsicherheitsschätzungen zu erhalten. Beispiele sind Random Forests, Dropout-Netzwerke und Deep Ensembles. Diese Methoden liefern oft gute Ergebnisse, aber ihre Unsicherheitsschätzungen haben nicht immer eine einfache probabilistische Interpretation.
Direkte Intervallschätzungsmethoden werden speziell darauf trainiert, Vorhersageintervalle direkt auszugeben, ohne zunächst eine Verteilung zu modellieren. Beispiele sind Quantilsregression und Methoden, die das "High-Quality"-Prinzip verwenden. Diese Methoden sind speziell auf die Intervallschätzung ausgerichtet, können aber keine Punktvorhersagen liefern.
Konforme Vorhersage ist ein allgemeiner Rahmen, der jede Punktvorhersagemethode in einen gültigen Intervallschätzer umwandeln kann. Durch die Verwendung eines Nonkonformitätsmaßes und einer Kalibrierungsstichprobe können gültige, wenn auch möglicherweise konservative, Vorhersageintervalle erzeugt werden. Dieser Ansatz ist sehr flexibel und kann auch verwendet werden, um bestehende Intervallschätzer zu kalibrieren.
Die experimentellen Ergebnisse auf Benchmark-Datensätzen zeigen, dass die Leistung der verschiedenen Methoden stark von den Dateneigenschaften abhängt. Einige Methoden machen Annahmen, die in der Praxis oft verletzt sind, was zu ungültigen Intervallen führt. Konforme Vorhersage kann hier als allgemeines Kalibrierungsverfahren eingesetzt werden, um diese Probleme zu beheben.
Stats
Die Vorhersageintervalle sollten eine vorgegebene Überdeckungswahrscheinlichkeit haben, ohne dabei zu konservativ zu sein.
Die durchschnittliche Breite der Vorhersageintervalle sollte möglichst gering sein.
Quotes
"Für viele Anwendungen ist es wichtig, gut kalibrierte Vorhersageintervalle zu haben."
"Konforme Vorhersage kann als allgemeiner Rahmen verwendet werden, um jede Punktvorhersagemethode in einen gültigen Intervallschätzer umzuwandeln."