Core Concepts
Das OrCo-Verfahren verbessert die Leistung des inkrementellen Lernens mit wenigen Beispielen, indem es die inhärenten Herausforderungen wie katastrophales Vergessen, Überanpassung und Starrheit durch die Nutzung der gegenseitigen Orthogonalität von Merkmalen im Darstellungsraum und kontrastives Lernen angeht.
Abstract
Der Artikel stellt einen neuartigen Ansatz namens OrCo vor, der darauf abzielt, die Leistung des inkrementellen Lernens mit wenigen Beispielen (FSCIL) zu verbessern. FSCIL ist ein Szenario, in dem neue Informationen mit nur wenigen beschrifteten Beispielen eingeführt werden, was zu Herausforderungen wie katastrophalem Vergessen, Überanpassung und Starrheit führt.
Der OrCo-Ansatz besteht aus drei Phasen:
Pretraining: In dieser Phase wird das Modell unter Verwendung einer Kombination aus überwachtem und selbstüberwachtem kontrastivem Lernen auf dem Basisdatensatz vortrainiert. Dies verbessert die Generalisierungsfähigkeit der Merkmalsdarstellung und adressiert implizit die Starrheitsproblematik.
Basisausrichtung: In dieser Phase wird das Modell auf zufällig generierte, gegenseitig orthogonale Pseudoziele ausgerichtet, indem die OrCo-Verlustfunktion optimiert wird. Dies maximiert die Abstände zwischen den Klassen und reserviert Platz für zukünftige inkrementelle Klassen, was Überanpassung und katastrophales Vergessen entgegenwirkt.
Wenig-Beispiel-Ausrichtung: In jeder nachfolgenden inkrementellen Sitzung wird das Modell ähnlich wie in Phase 2 auf die Pseudoziele ausgerichtet, wobei die OrCo-Verlustfunktion verwendet wird, um die Herausforderungen der begrenzten Daten zu bewältigen.
Die experimentellen Ergebnisse zeigen, dass der OrCo-Ansatz den Stand der Technik auf drei gängigen Benchmarkdatensätzen übertrifft und die Leistung über alle inkrementellen Sitzungen hinweg konsistent verbessert.
Stats
Die Datensätze mini-ImageNet und CIFAR100 haben jeweils 60% der Daten in den Basisklassen, während CUB200 50% der Daten in den Basisklassen hat.
Die durchschnittliche harmonische Genauigkeit (aHM) ist eine robuste Bewertungsmetrik, die den Bias gegenüber Basisklassen berücksichtigt.
Quotes
"Das OrCo-Verfahren verbessert die Leistung des inkrementellen Lernens mit wenigen Beispielen, indem es die inhärenten Herausforderungen wie katastrophales Vergessen, Überanpassung und Starrheit durch die Nutzung der gegenseitigen Orthogonalität von Merkmalen im Darstellungsraum und kontrastives Lernen angeht."