Core Concepts
Durch den Einsatz verschiedener Trainingskriterien zur Bildung unterschiedlicher Modellverständnisse kann die Diversität der Merkmalsdarstellung in einem Ensemble-Modell erhöht werden, was zu einer verbesserten Erkennung von Daten außerhalb der Verteilung führt.
Abstract
In dieser Arbeit wird untersucht, wie die Diversität der Merkmalsdarstellung in Ensemble-Modellen die Leistung bei der Erkennung von Daten außerhalb der Verteilung (Out-of-Distribution, OOD) verbessern kann.
Die Autoren zeigen zunächst, dass herkömmliche Ensemble-Methoden, die sich auf unterschiedliche Initialisierungen oder Datenteilmengen stützen, nicht ausreichend Diversität in der Merkmalsdarstellung erzeugen können. Dies führt dazu, dass die Leistung des Ensemble-Modells bei der OOD-Erkennung nur geringfügig besser ist als die eines einzelnen Modells vergleichbarer Größe.
Um die Diversität zu erhöhen, schlagen die Autoren ein neuartiges Ensemble-Verfahren vor, das sie "Multi-Comprehension Ensemble" (MC Ensemble) nennen. Dabei werden die individuellen Modelle des Ensembles nicht nur mit unterschiedlichen Initialisierungen, sondern auch mit verschiedenen Trainingskriterien trainiert. Dies führt dazu, dass die Modelle unterschiedliche Verständnisse der Eingabedaten und -labels entwickeln, was sich in einer Erweiterung des Merkmalsdarstellungsraums niederschlägt.
In Experimenten auf den CIFAR10- und ImageNet-Benchmarks zeigt das MC Ensemble eine deutlich überlegene Leistung bei der OOD-Erkennung im Vergleich zu herkömmlichen Ensemble-Methoden und einzelnen Modellen vergleichbarer Größe. Die Autoren führen dies auf die erhöhte Diversität der Merkmalsdarstellung zurück, die durch den Einsatz verschiedener Trainingskriterien erreicht wird.
Stats
Die Autoren verwenden verschiedene Metriken, um die Leistung der Modelle bei der OOD-Erkennung zu bewerten, darunter:
FPR95: Die False Positive Rate bei einer True Positive Rate von 95%
AUROC: Die Fläche unter der Receiver Operating Characteristic Curve
Quotes
"Durch den Einsatz verschiedener Trainingskriterien zur Bildung unterschiedlicher Modellverständnisse kann die Diversität der Merkmalsdarstellung in einem Ensemble-Modell erhöht werden, was zu einer verbesserten Erkennung von Daten außerhalb der Verteilung führt."
"In Experimenten auf den CIFAR10- und ImageNet-Benchmarks zeigt das MC Ensemble eine deutlich überlegene Leistung bei der OOD-Erkennung im Vergleich zu herkömmlichen Ensemble-Methoden und einzelnen Modellen vergleichbarer Größe."