Effizientes Prüfen und Analysieren von Inhalten durch Cross-Attention Token Pruning für genaue multimodale Modelle
Cross-Attention Token Pruning (CATP) ist eine präzisionsorientierte Token-Ausdünnungsmethode, die die Genauigkeit von großen multimodalen Modellen wie BLIP-2 erhält, indem sie die Relevanz der Abfrage-Token anhand der Kreuzaufmerksamkeitswahrscheinlichkeiten bewertet.