Core Concepts
반복 직선 프로그램(ISLP)은 기존의 직선 프로그램(SLP)을 확장한 것으로, 일부 문자열 집합에 대해 δ 복잡도 하한을 깨는 압축 성능을 보여준다. 또한 ISLP는 압축된 문자열에서 효율적으로 부분 문자열을 추출할 수 있는 기능을 제공한다.
Abstract
이 논문은 기존의 직선 프로그램(SLP)을 일반화한 일반화 직선 프로그램(GSLP)을 소개하고, 이를 균형 잡힌 GSLP로 변환하는 방법을 제시한다. 이를 바탕으로 반복 직선 프로그램(ISLP)을 정의하고, ISLP가 일부 문자열 집합에 대해 δ 복잡도 하한을 깰 수 있음을 보인다. 또한 ISLP를 이용하여 압축된 문자열에서 부분 문자열을 효율적으로 추출할 수 있는 방법을 제안한다.
구체적으로:
GSLP는 SLP에 Turing-complete 프로그램을 사용하는 규칙을 추가한 것으로, 균형 잡힌 GSLP로 변환할 수 있음을 보인다.
ISLP는 GSLP의 특별한 경우로, 반복 규칙 A → Πk2i=k1 Bici1 ... Bicttt를 허용한다.
ISLP는 일부 문자열 집합에 대해 δ 복잡도 하한을 깰 수 있음을 보인다.
ISLP를 균형 잡힌 GSLP로 변환하여, 압축된 문자열에서 부분 문자열을 효율적으로 추출할 수 있는 방법을 제안한다.
이를 통해 ISLP는 기존의 압축 표현보다 작으면서도 부분 문자열 추출이 가능한 첫 번째 사례가 된다.
Stats
문자열 T의 길이 n
문자열 T를 생성하는 d-ISLP G의 크기 |G|
d-ISLP G의 높이 h