מושגי ליבה
Die Integration von visuellen Informationen verbessert die Leistung der Few-Shot-Relationsextraktion signifikant.
תקציר
Few-Shot Relation Extraction mit Hybrid Visual Evidence
Ziel: Vorhersage von Beziehungen zwischen Entitäten in einem Satz mit wenigen markierten Instanzen
Multi-Modales Few-Shot-Modell (MFS-HVE) nutzt textuelle und visuelle semantische Informationen
Experimente zeigen, dass visuelle Informationen die Leistung der Few-Shot-Relationsextraktion verbessern
Modelle mit Multi-Modalität übertreffen Text-basierte Modelle
Ablationsstudie zeigt, dass die Fusion von visuellen und textuellen Informationen entscheidend ist
Fallstudie zeigt, dass visuelle Informationen fehlende Kontexte in Texten ergänzen
Parameterstudie zeigt, dass die Anzahl der eingebetteten Objekte die Leistung beeinflusst
סטטיסטיקה
Die MFS-HVE-Modelle verbessern die Leistung signifikant.
Die Modelle mit visuellen Informationen übertreffen Text-basierte Modelle.
Die besten Ergebnisse werden erzielt, wenn zwei Objekte eingebettet sind.
ציטוטים
"Die Modelle mit Multi-Modalität performen besser als Text-basierte Modelle."
"Die visuellen Informationen ergänzen die fehlenden Kontexte in Texten."