Ein einheitliches Architektur für die Bildsegmentierung, das verschiedene Aufgaben und Datensätze unterstützt
Das vorgestellte Mixed-Query Transformer (MQ-Former) Modell ist eine einheitliche Architektur für die Bildsegmentierung, die verschiedene Segmentierungsaufgaben und -datensätze mit einem einzigen Satz von Gewichten effektiv handhaben kann. Dies wird durch eine neuartige gemischte Abfragestrategie ermöglicht, die dynamisch verschiedene Arten von Objekten berücksichtigt, ohne auf heuristische Designs angewiesen zu sein. Darüber hinaus nutzt das einheitliche Modell synthetische Daten, um die Generalisierungsfähigkeit weiter zu verbessern.