Die Studie zeigt, dass generatives Retrieval (GR) und Multi-Vektor-Dense-Retrieval (MVDR) den gleichen Rahmen zur Messung der Relevanz eines Dokuments für eine Abfrage teilen. Konkret wird abgeleitet, dass die Logits in der Verlustfunktion von GR als Produkt von Dokumentworteinbettungen, Abfragetoken-Vektoren und einer Ausrichtungsmatrix dargestellt werden können, was dem vereinheitlichten MVDR-Rahmen entspricht.
Die Studie untersucht auch die unterschiedlichen Strategien von GR und MVDR bei der Dokumentenkodierung und der Ausrichtungsstrategie. GR verwendet eine einfachere Dokumentenkodierung, die durch Methoden wie PAWA-Decodierung und NP-Decodierung verbessert werden kann, um die Ausdrucksfähigkeit zu erhöhen. Außerdem verwenden GR und MVDR unterschiedliche Ausrichtungsrichtungen (Abfrage-zu-Dokument vs. Dokument-zu-Abfrage), die jeweils Vor- und Nachteile haben.
Insgesamt bietet die Studie neue Erkenntnisse über den Zusammenhang zwischen GR und MVDR und liefert eine theoretische Grundlage für die Weiterentwicklung von GR-Methoden.
To Another Language
from source content
arxiv.org
Дополнительные вопросы