Core Concepts
Durch den Einsatz von optimalem Transport kann die Leistung von Nullklassen-Klassifizierungsmodellen deutlich verbessert werden, indem die Vorhersageverteilung an die geschätzte Zielverteilung der Klassen angepasst wird.
Abstract
Der Artikel beschreibt eine Methode namens OTTER (Optimal TransporT adaptER), um die Leistung von Nullklassen-Klassifizierungsmodellen zu verbessern. Nullklassen-Modelle, die auf großen Trainingsdatensätzen vortrainiert wurden, leiden oft unter Verzerrungen in der Klassenverteilung, die sich negativ auf die Leistung in Zielaufgaben auswirken.
OTTER nutzt den Rahmen des optimalen Transports, um die Vorhersagen des Nullklassen-Modells so anzupassen, dass sie besser zur geschätzten Zielverteilung der Klassen passen. Dafür wird ein Transportplan berechnet, der die Eingabedaten optimal auf die Zielklassen verteilt, um die Gesamtkosten gemäß der Zielverteilung zu minimieren.
Die Autoren zeigen theoretisch, dass OTTER unter bestimmten Bedingungen den Bayes-optimalen Klassifikator für die Zielverteilung wiederherstellen kann. Außerdem analysieren sie die Empfindlichkeit von OTTER gegenüber Fehlern in der Schätzung der Zielverteilung und der Kalibrierung der Modellvorhersagen.
In umfangreichen Experimenten auf Bild- und Textklassifizierungsdatensätzen zeigt OTTER deutliche Verbesserungen gegenüber dem Nullklassen-Modell und anderen Baseline-Methoden. Darüber hinaus lässt sich OTTER auch in Wenig-Schuss-Lernszenarien einsetzen, wenn die Zielverteilung geschätzt wird.
Stats
Die Genauigkeit von Nullklassen-Modellen wie CLIP und BERT leidet stark unter Unterschieden zwischen der Klassenverteilung im Trainingsdatensatz und der Zielaufgabe.
In Experimenten auf 17 Bilddatensätzen verbesserte OTTER die Genauigkeit im Durchschnitt um 4,8% gegenüber dem Nullklassen-Modell.
Auf 4 Textklassifizierungsdatensätzen erzielte OTTER im Durchschnitt eine 15,5% höhere Genauigkeit als das Nullklassen-Modell.
Quotes
"Durch den Einsatz von optimalem Transport kann die Leistung von Nullklassen-Klassifizierungsmodellen deutlich verbessert werden, indem die Vorhersageverteilung an die geschätzte Zielverteilung der Klassen angepasst wird."
"OTTER kann unter bestimmten Bedingungen den Bayes-optimalen Klassifikator für die Zielverteilung wiederherstellen."