Trainings-, Annotations- und Führungsfreie Open-Vocabulary-Semantische Segmentierung
Unser TAG-Ansatz ermöglicht eine offene Vokabular-semantische Segmentierung ohne zusätzliches Training, dichte Annotationen oder Textführung, indem er semantische Merkmale aus jedem Pixel extrahiert und dann die offenen Vokabular-Kategorien basierend auf diesen Merkmalen aus einer externen Datenbank abruft.