Die Autoren stellen eine neue Familie von höhenbeschränkten Lempel-Ziv-Kodierungen (LZHB) vor, die eine Variante der Lempel-Ziv-Parsings mit dem Fokus auf schnellem Zugriff auf beliebige Positionen des Textes direkt über die komprimierte Darstellung sind. Jede LZHB-Kodierung, deren Referenzhöhe durch h beschränkt ist, ermöglicht den Zugriff auf eine beliebige Position des zugrunde liegenden Textes in O(h) Zeit mithilfe von Vorgängerabfragen.
Die Autoren zeigen, dass es eine Konstante c gibt, so dass die Größe ˆzHB(c log n) der optimalen (kleinsten) LZHB-Kodierung, deren Höhe durch c log n beschränkt ist, für jeden String der Länge n, O(ˆgrl) ist, wobei ˆgrl die Größe der kleinsten Laufzeitgrammatik ist. Darüber hinaus zeigen sie, dass es eine Familie von Strings gibt, für die ˆzHB(c log n) = o(ˆgrl) gilt, was ˆzHB(c log n) zu einer der kleinsten bekannten Wiederholungsmaße macht, für die O(polylog(n))-Zeitlicher Zugriff mit O(ˆzHB(c log n))-Platz möglich ist.
Während das Berechnen der optimalen LZHB-Darstellung für eine gegebene Höhe schwierig zu sein scheint, schlagen die Autoren lineare und fast lineare Zeit gierige Algorithmen vor, von denen sie zeigen, dass sie in der Praxis effizient kleine LZHB-Darstellungen finden können.
To Another Language
from source content
arxiv.org
Дополнительные вопросы