Der Artikel stellt GenView vor, ein Rahmenwerk, das die Qualität der Ansichten für selbstüberwachtes Lernen durch den Einsatz eines vortrainierten generativen Modells verbessert.
Zunächst wird eine adaptive Methode zur Erzeugung von Ansichten entwickelt, die den Rauschpegel dynamisch an die Merkmale des Eingabebilds anpasst, um einen Ausgleich zwischen Diversität und semantischer Treue zu erreichen.
Darüber hinaus wird eine qualitätsgesteuerte kontrastive Verlustfunktion eingeführt, die hochwertige Paare mit hoher Vordergrundähnlichkeit und niedriger Hintergrundähnlichkeit priorisiert und den Einfluss minderwertiger oder falscher Paare reduziert.
Experimente zeigen, dass GenView die Leistung verschiedener SSL-Methoden wie MoCov2, BYOL, SwAV und MoCov3 auf Aufgaben wie linearer Klassifizierung, Objekterkennung und Instanzsegmentierung deutlich verbessert. GenView übertrifft auch den naiven Ansatz, den ImageNet-Datensatz mit Laion400M oder ImageNet21K zu erweitern.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Xiaojie Li,Y... at arxiv.org 03-19-2024
https://arxiv.org/pdf/2403.12003.pdfDeeper Inquiries