Основные понятия
G-Retriever ist ein flexibler Ansatz zur Beantwortung von Fragen über Textgraphen, der die Stärken von Graphneuronalen Netzen, Großen Sprachmodellen und Retrieval-Augmented Generation nutzt. Er ermöglicht effizientes und präzises Frage-Antwort-Verhalten selbst für komplexe und kreative Anfragen.
Аннотация
Der Artikel stellt einen neuen Benchmark namens GraphQA vor, der eine umfassende und vielfältige Sammlung von Datensätzen für graphbasierte Frage-Antwort-Aufgaben in verschiedenen Anwendungsdomänen wie Alltagslogik, Szenenverständnis und Wissensrepräsentation umfasst.
Um diese Aufgaben effektiv zu lösen, präsentiert der Artikel G-Retriever, eine neuartige Architektur, die die Stärken von Graphneuronalen Netzen, Großen Sprachmodellen und Retrieval-Augmented Generation kombiniert. G-Retriever adressiert die Probleme der Halluzination und mangelnden Skalierbarkeit, die bei bestehenden Ansätzen auftreten.
Der Schlüssel zu G-Retrievers Leistungsfähigkeit ist die Formulierung der Teilgraph-Abrufaufgabe als ein Prize-Collecting Steiner Tree Optimierungsproblem. Dies ermöglicht es, nur die für die Anfrage relevanten Teile des Graphen abzurufen und effizient in das Große Sprachmodell einzubinden.
Die empirischen Ergebnisse zeigen, dass G-Retriever die Leistung von Baseline-Methoden in verschiedenen Textgraph-Aufgaben übertrifft, gut mit größeren Graphgrößen skaliert und Halluzinationen effektiv vermeidet.
Статистика
"Unser Ansatz überwindet diese Probleme, indem er die Teilgraph-Abrufaufgabe als ein Prize-Collecting Steiner Tree Optimierungsproblem formuliert."
"Für den SceneGraphs-Datensatz führte die Implementierung unseres graphbasierten Abrufs zu einer Reduzierung der durchschnittlichen Tokenanzahl um 83%, für den WebQSP-Datensatz sogar um 99%."
"Unser Verfahren reduziert Halluzinationen um 54% im Vergleich zur Baseline."
Цитаты
"G-Retriever zeigt effektive Fähigkeiten zum Graphverständnis und vereint gleichzeitig die Benutzerfreundlichkeit von Konversationsschnittstellen."
"Bestehende Arbeiten konzentrieren sich meist auf konventionelle Graphaufgaben oder das Beantworten einfacher Graphanfragen auf kleinen oder synthetischen Graphen. Im Gegensatz dazu entwickeln wir einen flexiblen Frage-Antwort-Rahmen, der auf reale Textgraphen abzielt und auf mehrere Anwendungen wie Szenengrafikverständnis, Alltagslogik und Wissensgrafreasoning anwendbar ist."