מושגי ליבה
Der E2LSH-Algorithmus für Nearest-Neighbor-Suche kann durch effiziente Nutzung moderner Flash-Speichergeräte wie SSDs deutlich schneller als kleine-Index-Methoden ausgeführt werden und sogar Geschwindigkeiten der In-Memory-Ausführung erreichen.
תקציר
Die Studie analysiert zunächst den E2LSH-Algorithmus, um die Anforderungen an Speicherperformanz für eine externe Speicherimplementierung (E2LSHoS) zu identifizieren.
Schlüsselergebnisse:
- Der Rechenaufwand von E2LSH ist deutlich geringer als bei kleinen-Index-Methoden wie SRS und QALSH.
- E2LSH benötigt mehrere hundert I/O-Vorgänge pro Abfrage, wobei die Anzahl mit höherer Genauigkeit und kleineren Blockgrößen steigt.
- Um Geschwindigkeiten von SRS zu erreichen, benötigt E2LSHoS eine Speicherperformanz von einigen hundert kIOPS, die mit einem einzelnen Consumer-SSD mit asynchronen I/Os erreicht werden kann.
- Um Geschwindigkeiten der In-Memory-Ausführung von E2LSH zu erreichen, sind Speicherperformanz von einigen MIOPS und geringe CPU-Overhead von Dutzenden Nanosekunden erforderlich, was mit modernen Hochleistungsspeichern möglich ist.
Die Ergebnisse zeigen, dass große-Index-LSH-Methoden wie E2LSH durch Nutzung moderner Speichergeräte wieder wettbewerbsfähig werden können, ohne ihre theoretischen Garantien zu verlieren.
סטטיסטיקה
Die Anzahl der I/O-Vorgänge pro Abfrage (NI/O) beträgt im Durchschnitt:
133,6 für MSONG
347,5 für SIFT
48,7 für GIST
196,5 für RAND
317,2 für GLOVE
190,8 für GAUSS
393,7 für MNIST
791,0 für BIGANN (100M)
ציטוטים
Keine relevanten Zitate identifiziert.