Core Concepts
Das Ziel ist es, eine Vorhersagefunktion zu konstruieren, die die Leistung in extremen Regionen des Eingaberaums optimiert. Dafür wird ein Rahmenwerk auf Basis der multivariaten Regularitätstheorie entwickelt, das es ermöglicht, die asymptotische Leistung in extremen Regionen zu charakterisieren und zu optimieren.
Abstract
Der Artikel behandelt das Problem der Regression in extremen Regionen. Dabei wird angenommen, dass die Verteilung des Eingabevektors X schwanzlastig ist, d.h. regelmäßig variierend.
Zunächst wird ein allgemeiner Rahmen für die Regression auf Extremwerte entwickelt. Unter geeigneten Annahmen zur regelmäßigen Variation des Paares (X, Y) wird gezeigt, dass ein asymptotisches Risikomaß geeignet ist, um die Vorhersageleistung in extremen Regionen zusammenzufassen.
Es wird bewiesen, dass die Minimierung einer empirischen und nicht-asymptotischen Version dieses "extremen Risikos", basierend nur auf einem Bruchteil der größten Beobachtungen, eine gute Verallgemeinerungsleistung ergibt. Darüber hinaus liefern numerische Ergebnisse starke empirische Belege für die Relevanz des vorgeschlagenen Ansatzes.
Insbesondere wird gezeigt, dass Vorhersagefunktionen, die nur von der Richtung des Eingabevektors X abhängen, die beste asymptotische Leistung erreichen. Darauf aufbauend wird ein empirisches Risikominimierungsverfahren vorgeschlagen, das auf einem Bruchteil der Beobachtungen mit den größten Normen basiert. Für diesen Schätzer werden nicht-asymptotische Schranken für den Überschuss des asymptotischen Risikos bewiesen, die seine Optimalität belegen.
Stats
Die Verteilung von X ist regelmäßig variierend mit Index α > 0.
Der Zielwert Y ist fast sicher beschränkt auf das Intervall [-M, M].
Quotes
"Das Ziel ist es, eine Vorhersagefunktion zu konstruieren, die die Leistung in extremen Regionen des Eingaberaums optimiert."
"Es wird bewiesen, dass die Minimierung einer empirischen und nicht-asymptotischen Version dieses "extremen Risikos", basierend nur auf einem Bruchteil der größten Beobachtungen, eine gute Verallgemeinerungsleistung ergibt."