Die Studie vergleicht die Leistung von Menschen und Großen Sprachmodellen (LLMs) bei der Lösung visueller Analogien aus dem Abstraction Reasoning Corpus (ARC). Dafür wurden zwei vereinfachte ARC-Aufgabensets entwickelt, die an die Fähigkeiten von Kindern in verschiedenen Entwicklungsphasen angepasst sind.
Die Ergebnisse zeigen, dass sowohl Kinder als auch Erwachsene die meisten LLMs bei diesen Aufgaben übertreffen. Die Fehleranalyse offenbarte eine ähnliche "Rückfall"-Lösungsstrategie bei LLMs und jungen Kindern, bei der ein Teil der Analogie einfach kopiert wird. Darüber hinaus wurden zwei weitere Fehlertypen identifiziert: Konzeptfehler, bei denen die Teilnehmer das Konzept (z.B. Position) verstehen, aber einen Fehler in der Anwendung machen, sowie Matrixfehler, bei denen die Antwort auf einer einfachen Kombination der Eingabematrizen basiert. Konzeptfehler waren häufiger bei Menschen, Matrixfehler häufiger bei LLMs.
Diese Studie wirft neues Licht auf die Fähigkeiten von LLMs zur Analogiebildung und zeigt, inwieweit Fehleranalysen und Vergleiche mit der menschlichen Entwicklung dazu beitragen können, zu verstehen, wie LLMs visuelle Analogien lösen.
To Another Language
from source content
arxiv.org
Deeper Inquiries