Der Artikel beschreibt einen neuen deterministischen Algorithmus zur Quantilschätzung, der eine optimale Speicherkomplexität von O(ε−1) Worten erreicht. Dies stellt eine Verbesserung gegenüber den bisher bekannten Algorithmen wie GK-Sketch und q-Digest dar.
Der Algorithmus basiert auf einer rekursiven Struktur, die an den q-Digest-Algorithmus angelehnt ist. Die Hauptidee ist es, die Knoten des q-Digest-Baums, die nicht voll sind, in einer separaten Datenstruktur zu verwalten. Dadurch kann der Speicherverbrauch deutlich reduziert werden.
Im Detail besteht der Algorithmus aus mehreren Rekursionsebenen. Auf der obersten Ebene (Ebene 0) wird ein optimierter q-Digest-Baum verwendet, der nur volle Knoten speichert. Darüber hinaus gibt es weitere Ebenen (Ebene 1 bis k), die als Puffer für neue Elemente dienen. Wenn genügend Elemente in den unteren Ebenen gesammelt wurden, werden sie komprimiert und in den q-Digest-Baum der oberen Ebene eingefügt.
Durch diese Struktur und sorgfältige Parameterwahl kann der Algorithmus den optimalen Speicherverbrauch von O(ε−1) Worten erreichen. Außerdem wird gezeigt, dass der Algorithmus deterministisch ist und somit robuster als randomisierte Verfahren.
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor