Core Concepts
Ein neuartiges Framework für eine effiziente Multi-Vektor-Dichte-Suche, das die Leistung des aktuellen Spitzensystems PLAID deutlich verbessert.
Abstract
Der Artikel präsentiert EMVB, ein neuartiges Framework für eine effiziente Multi-Vektor-Dichte-Suche. EMVB baut auf PLAID auf, dem derzeitigen Stand der Technik, und führt vier neue Beiträge ein:
- EMVB verwendet einen hocheffizienten Vorfilterungsschritt für Passagen mithilfe optimierter Bitvektoren, um die Kandidatenpassagen-Filterungsphase zu beschleunigen.
- Die Berechnung der Zentroiden-Interaktion erfolgt mit reduzierter Genauigkeit.
- EMVB nutzt Produktquantisierung, um den Speicherplatzbedarf für Vektordarstellungen zu reduzieren und gleichzeitig eine schnelle Spätinteraktion zu ermöglichen.
- Es wird ein passagenspezifisches Termfilter für die Spätinteraktion eingeführt, um die Kosten dieses Schritts um bis zu 30% zu senken.
Die experimentelle Auswertung zeigt, dass EMVB im domäneninternen Test bis zu 2,8-mal schneller ist und den Speicherplatzbedarf um 1,8-mal reduziert, ohne Einbußen bei der Abrufqualität gegenüber PLAID. Im domänenübergreifenden Test ist EMVB bis zu 2,9-mal schneller, mit nur geringfügigen Einbußen bei der Abrufqualität.
Stats
Die Einführung von vortrainierten großen Sprachmodellen hat die Effektivität von Informationsrückgewinnungssystemen deutlich verbessert.
Multi-Vektor-Techniken verwenden ein Sprachmodell, um eine dichte Darstellung für jeden Token eines Passus zu erstellen, was zu einer überlegenen Effektivität im Vergleich zu Einzelvektor-Techniken oder Sparse-Retrieval-Techniken führt.
Der verbesserte Abruf von Multi-Vektor-Systemen geht jedoch zu Lasten eines um eine Größenordnung höheren Speicherbedarfs und einer höheren Abfragelatenz.
Quotes
"EMVB ist bis zu 2,8-mal schneller und reduziert den Speicherplatzbedarf um 1,8-mal, ohne Einbußen bei der Abrufqualität gegenüber PLAID."
"Im domänenübergreifenden Test ist EMVB bis zu 2,9-mal schneller, mit nur geringfügigen Einbußen bei der Abrufqualität."