Das Ziel dieser Studie ist es, eine mehrsprachige, erweiterbare wissensbasierte visuelle Fragebeantworung (KB-VQA) zu entwickeln, indem Wissensrepräsentationen aus Hochsprachen genutzt werden, um Datensätze für Niedrigsprachen zu erstellen.
Dieser Datensatz zielt darauf ab, die Fähigkeit von VQA-Modellen zu verbessern, unantwortbare Fragen zu erkennen und sich zu enthalten, um die Zuverlässigkeit von KI-Systemen zu erhöhen.