Evaluierung der Fähigkeit von Vision-Sprache-Modellen, aus der Ich-Perspektive zu denken
Die Fähigkeit von Vision-Sprache-Modellen, aus der Ich-Perspektive zu "denken", ist entscheidend für die Weiterentwicklung autonomer Agenten und der Robotik, bleibt aber weitgehend unerforsch