本文提出了一種新型的索引結構,可以在亞線性時間內快速找到字符串中子串的最左出現位置。這個索引結構是通過引入一種新的查詢操作 - 前綴範圍最小查詢 (prefix range minimum query) 來實現的。我們首先設計了一個高效的前綴範圍最小查詢數據結構,然後利用它來構建這個索引。
對於二進制字符串,我們的算法在 O(n/√log n) 時間內計算 LZ77 分解,使用 O(n/log n) 的工作空間。對於一般整數字母表,時間複雜度變為 O((n log σ)/√log n)、空間複雜度為 O(n/logσ n)。我們的算法還可以處理不允許重疊的 LZ77 分解。
我們的技術突破包括:
這些技術的組合使我們能夠在亞線性時間內計算 LZ77 分解,這是一個長期以來一直存在的問題。
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Dominik Kemp... a las arxiv.org 09-19-2024
https://arxiv.org/pdf/2409.12146.pdfConsultas más profundas