Die Studie untersucht das Problem der Anomalieerkennung (AD) in Situationen mit langen Schwanzklassen-Verteilungen, bei denen einige Klassen deutlich mehr Beispiele aufweisen als andere. Dies ist in vielen realen Anwendungen der Fall, wird aber in bisherigen AD-Methoden nicht berücksichtigt.
Um dieses Problem anzugehen, werden zunächst mehrere Datensätze mit unterschiedlichen Graden an Klassenungleichgewicht erstellt. Darauf aufbauend wird eine neue Methode namens LTAD vorgestellt, die zwei Ansätze kombiniert:
AD durch Rekonstruktion: Ein Transformator-basiertes Rekonstruktionsmodul projiziert Bildpatches in den Raum normaler Bilder. Die Rekonstruktionsfehler dienen als Anomalie-Score.
Semantische AD: Ein binärer Klassifikator nutzt gelernte Pseudo-Klassennamen und ein vortrainiertes Sprachmodell, um Normalität/Anomalität zu klassifizieren.
Um die Herausforderungen langer Schwanzklassen zu adressieren, lernt LTAD in einer ersten Phase lernbare Pseudo-Klassennamen und verwendet ein variationelles Autoenkoder-Modell, um synthetische Trainingsdaten für Minderheitsklassen zu erzeugen. In einer zweiten Phase werden dann die Parameter des Rekonstruktions- und Klassifikationsmoduls optimiert.
Experimente zeigen, dass LTAD die State-of-the-Art-Methoden auf den meisten langen Schwanzklassen-Datensätzen übertrifft. Alle Komponenten von LTAD tragen zu dieser überlegenen Leistung bei.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Chih-Hui Ho,... at arxiv.org 04-01-2024
https://arxiv.org/pdf/2403.20236.pdfDeeper Inquiries