Core Concepts
바운디드 액세스 Lempel Ziv 코딩 문제는 NP-hard이며 APX-hard이다. 즉, 최적의 바운디드 액세스 Lempel Ziv 코딩을 찾는 것은 어려운 문제이다.
Abstract
이 논문은 바운디드 액세스 Lempel Ziv (BLZ) 코딩의 복잡도와 근사가능성을 분석한다. BLZ 코딩은 문자열 s의 인코딩에서 임의의 위치 p의 문자 sp를 최대 c번의 액세스로 식별/압축 해제할 수 있는 파싱을 찾는 문제이다.
주요 결과는 다음과 같다:
- 모든 상수 c에 대해 c-BLZ 문제는 NP-hard이다.
- c-BLZ 문제는 APX-hard이므로, P≠NP 가정 하에 PTAS(Polynomial-Time Approximation Scheme)가 존재하지 않는다.
- 최적 LZ76 파싱 크기와 최적 c-BLZ 파싱 크기의 비율은 최악의 경우 무한대로 발산한다.
이를 통해 바운디드 액세스 Lempel Ziv 코딩 문제가 이론적으로 어려운 문제임을 보였다.
Stats
문자열 s의 길이가 n일 때, 최적 LZ76 파싱의 크기는 O(log n)이다.
문자열 s가 제곱 자유(square-free)일 때, 모든 c-BLZ 파싱 ϕ에 대해 |ϕ(s)| ≥ (c+1)√|s| - 1이다.
Quotes
"We show that for any constant c the problem of computing the optimal c-BLZ parsing of a string, i.e., the one with the minimum number of phrases, is NP-hard and also APX hard, i.e., no PTAS can exist under the standard complexity assumption P ≠ NP."
"We also study the ratio between the sizes of an optimal c-BLZ parsing of a string s and an optimal LZ76 parsing of s (which can be greedily computed in polynomial time)."