Selbstbefragung für einen großen Assistenten für Sprache und Visionen (SQ-LLaVA)
SQ-LLaVA, ein neuartiger Ansatz zur Verbesserung der allgemeinen Verständnisfähigkeit von Sprache und Visionen, nutzt die Fähigkeit zur Selbstbefragung, um die Beziehung zwischen Bildern und Fragen zu erfassen und so eine bessere Ausrichtung von Sprache und Visionen zu erreichen, ohne zusätzliche Daten sammeln zu müssen.