Die Studie befasst sich mit der Herausforderung der domänenübergreifenden Wenig-Beispiel-Objekterkennung (CD-FSOD), bei der ein genauer Objektdetektor für neue Domänen mit minimalen beschrifteten Beispielen entwickelt werden soll.
Zunächst wird ein neuer Benchmark für CD-FSOD erstellt, der sechs verschiedene Datensätze mit unterschiedlichen Stilen, Klassen-Varianzen und Objektgrenzen umfasst. Die Evaluierung zeigt, dass bestehende Methoden, einschließlich leistungsfähiger Open-Set-Detektoren, Schwierigkeiten haben, über Domänengrenzen hinweg zu generalisieren.
Um diese Herausforderungen zu adressieren, wird eine neue Methode namens CD-ViTO vorgestellt. CD-ViTO baut auf dem Open-Set-Detektor DE-ViT auf und führt mehrere Verbesserungen ein: Lernbare Instanzmerkmale, um die Unterscheidbarkeit der Merkmale zu erhöhen, ein Instanz-Gewichtungsmodul, um Instanzen mit klaren Grenzen zu priorisieren, und ein Domänen-Prompter, um die Robustheit gegenüber Stilveränderungen zu verbessern. Zusätzlich wird das Finetuning der Methode untersucht.
Die Ergebnisse zeigen, dass CD-ViTO die Leistung des Basis-DE-ViT-Detektors deutlich übertrifft und neue State-of-the-Art-Ergebnisse in der CD-FSOD-Benchmark erzielt.
На другой язык
из исходного контента
arxiv.org
Дополнительные вопросы