Durch die Einführung eines neuartigen Dual-Pfad-Ansatzes, der sowohl positive als auch negative Perspektiven berücksichtigt, kann die Leistung von Vision-Sprache-Modellen in spezifischen Downstream-Aufgaben effizient verbessert werden.
Durch die Einführung eines neuartigen Dual-Pfad-Ansatzes, der sowohl positive als auch negative Perspektiven berücksichtigt, kann die Leistung von Vision-Sprache-Modellen in Downstream-Aufgaben effizient verbessert werden.