ReMamber: Effiziente Bildverweis-Segmentierung mit Mamba Twister
ReMamber ist eine neuartige Architektur, die die Leistungsfähigkeit von Mamba mit einem multimodalen Mamba Twister-Block integriert, um die Interaktion zwischen Bild und Text effektiv zu modellieren und die Fusion von Text- und Bildmerkmalen durch einen einzigartigen Kanal- und Raumscan-Mechanismus zu verbessern.