Entdeckung reicher visueller Hinweise durch das Mining von Frage-Antwort-Prompts für VQA mit vielfältigem Weltwissen
Das Sammeln reicher visueller Hinweise durch Frage-Antwort-Prompts verbessert die Fähigkeit von KI-Modellen zur visuellen Fragebeantwortung.