이 논문은 Lempel-Ziv (LZ77) 요인화 문제에 대한 새로운 접근법을 제시한다. LZ77 요인화는 문자열 처리 분야에서 가장 기본적이고 중요한 문제 중 하나이며, 다양한 응용 분야에서 핵심적인 역할을 한다.
주요 내용은 다음과 같다:
이 논문은 LZ77 요인화를 선형 시간 이하로 계산할 수 있는 최초의 알고리즘을 제시한다. 구체적으로, 이진 알파벳에 대해서는 O(n/√log n) 시간과 O(n/log n) 공간 복잡도를, 일반 정수 알파벳에 대해서는 O((n log σ)/√log n) 시간과 O(n/logσ n) 공간 복잡도를 달성한다.
이를 위해 저자들은 문자열의 최좌측 출현을 효율적으로 찾는 새로운 인덱스 구조를 개발한다. 이 인덱스는 O((n log σ)/√log n) 시간과 O(n/logσ n) 공간에 구축될 수 있으며, 임의의 부분 문자열에 대해 O(logϵ n) 시간 내에 최좌측 출현을 찾을 수 있다.
저자들은 새로운 유형의 쿼리인 접두사 범위 최소 쿼리(prefix range minimum query)를 정의하고, 이에 대한 효율적인 해결책을 제시한다. 이 쿼리는 최좌측 출현 인덱스의 핵심 구성 요소이다.
주기적인 문자열 영역과 비주기적인 문자열 영역을 구분하여 각각에 대한 효율적인 처리 기법을 개발한다.
이러한 기술적 기여를 통해 저자들은 LZ77 요인화 문제에 대한 선형 시간 장벽을 깨뜨리는 데 성공했다.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Dominik Kemp... a las arxiv.org 09-19-2024
https://arxiv.org/pdf/2409.12146.pdfConsultas más profundas