Die Studie befasst sich mit dem Problem der Multi-Ziel-Domänen-Adaption (MTDA) für semantische Segmentierung, bei dem ein einzelnes Modell über mehrere Zieldomänen mit unterschiedlichen Verteilungen hinweg hohe Leistung erzielen soll.
Bisherige Ansätze verwenden in der Regel mehrere Lehrer-Architekturen, bei denen jeder Lehrer auf eine Zieldomäne spezialisiert ist. Dies führt jedoch dazu, dass das Schülermodell das umfassende Wissen aus allen zielspezifischen Lehrern nur schwer vollständig aufnehmen kann.
Der vorgeschlagene OurDB-Rahmen verwendet stattdessen eine einzelne Lehrer-Architektur. Das Ouroboric Domain Selector (ODS)-Modul wechselt dabei zyklisch durch die Zieldomänen und konzentriert sich in jeder Iteration auf die Anpassung an eine Quelle-Ziel-Domänen-Kombination. Um zu verhindern, dass das Modell das Wissen über vorherige Zieldomänen vergisst, wird ein Anti-Vergessen-EMA-Mechanismus (AF-EMA) eingeführt, der sich auf Fisher-Informationen stützt.
Darüber hinaus wird ein kontext-gesteuertes klassen-weises Mixup (CGMix) vorgestellt, das die Kontextinformationen in den generierten Brücken zwischen Quell- und Zieldomänen berücksichtigt, um die Anpassung über verschiedene Zielkontexte hinweg zu verbessern.
Experimente auf vier städtischen Fahrdatensätzen zeigen, dass der OurDB-Rahmen die Leistung im Vergleich zu bestehenden State-of-the-Art-Methoden deutlich verbessert.
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Wichtige Erkenntnisse aus
by Seungbeom Wo... um arxiv.org 03-19-2024
https://arxiv.org/pdf/2403.11582.pdfTiefere Fragen