Der Artikel stellt ein tiefes latentes Variablenmodell namens RAISE vor, das in der Lage ist, generatives abstraktes Reasoning für Raven's Progressive Matrizen durchzuführen.
RAISE extrahiert interpretierbare Bildattribute wie Größe und Form als unabhängige latente Konzepte. Es abstrahiert dann die zugrundeliegenden Regeln der Matrizen in Form von atomaren Regeln, die als globale lernbare Parameter repräsentiert werden. Bei der Generierung von Antworten wählt RAISE die passenden atomaren Regeln für jedes latente Konzept aus und kombiniert sie, um die Zielbilder zu erzeugen.
Im Vergleich zu anderen generativen Lösern zeigt RAISE eine überlegene Leistung bei der Auswahl von Antworten am unteren rechten Rand sowie bei der Generierung von Antworten an beliebigen Positionen der Matrizen. Die Experimente zur Visualisierung der latenten Konzepte und zur Erkennung von regelabweichenden Bildern belegen die Interpretierbarkeit von RAISE. Darüber hinaus kann RAISE auch Konfigurationen mit unbekannten Kombinationen von Attributen und Regeln gut bewältigen, was auf seine Fähigkeit zur kompositionellen Generalisierung hindeutet.
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Fan Shi,Bin ... ב- arxiv.org 03-15-2024
https://arxiv.org/pdf/2401.09966.pdfשאלות מעמיקות