Der Artikel stellt ein tiefes latentes Variablenmodell namens RAISE vor, das in der Lage ist, generatives abstraktes Reasoning für Raven's Progressive Matrizen durchzuführen.
RAISE extrahiert interpretierbare Bildattribute wie Größe und Form als unabhängige latente Konzepte. Es abstrahiert dann die zugrundeliegenden Regeln der Matrizen in Form von atomaren Regeln, die als globale lernbare Parameter repräsentiert werden. Bei der Generierung von Antworten wählt RAISE die passenden atomaren Regeln für jedes latente Konzept aus und kombiniert sie, um die Zielbilder zu erzeugen.
Im Vergleich zu anderen generativen Lösern zeigt RAISE eine überlegene Leistung bei der Auswahl von Antworten am unteren rechten Rand sowie bei der Generierung von Antworten an beliebigen Positionen der Matrizen. Die Experimente zur Visualisierung der latenten Konzepte und zur Erkennung von regelabweichenden Bildern belegen die Interpretierbarkeit von RAISE. Darüber hinaus kann RAISE auch Konfigurationen mit unbekannten Kombinationen von Attributen und Regeln gut bewältigen, was auf seine Fähigkeit zur kompositionellen Generalisierung hindeutet.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Fan Shi,Bin ... at arxiv.org 03-15-2024
https://arxiv.org/pdf/2401.09966.pdfDeeper Inquiries