본 논문은 런렝스 인코딩(RLE)된 두 문자열 간의 최장 공통 부분 문자열(LCS)을 찾는 효율적인 양자 알고리즘을 제시합니다. 저자들은 먼저 RLE 문자열의 prefix-sum을 활용하는 것이 알고리즘의 효율성을 위해 필수적임을 강조합니다. prefix-sum oracle이 없다면, PARITY 문제로 환원하여 Ω(n/log2 n)의 양자 질의 복잡도 하한이 존재함을 증명합니다.
본 논문에서 제시된 양자 알고리즘은 기존의 문자열에 대한 LCS 알고리즘을 수정하여 RLE 문자열에 적용합니다. 핵심 아이디어는 인코딩된 길이와 디코딩된 길이 모두에서 이진 검색을 수행하는 것입니다. 외부 루프는 답의 디코딩된 길이 ˜d ∈[˜n]에 대해 이진 검색을 수행하고, 내부 루프는 인코딩된 길이 d = n/2, n/4, n/8, ... 에 대해 검색을 수행합니다. 각 내부 루프 반복에서 알고리즘은 인코딩된 길이가 [d, 2d]이고 디코딩된 길이가 ˜d 이상인 공통 부분 문자열이 있는지 확인합니다.
저자들은 Ambainis의 element distinctness 알고리즘을 활용하여 연결된 RLE 문자열 A$B의 앵커 세트에서 양자 보행을 수행합니다. 앵커 세트는 공통 부분 문자열이 존재하는 경우 A와 B의 해당 복사본이 동일한 위치에 "앵커"되도록 하는 A$B의 하위 집합입니다. 알고리즘은 앵커 세트의 요소에 대해 양자 보행을 수행하고 인코딩된 길이와 디코딩된 길이 모두에서 특정 조건을 충족하는 "충돌", 즉 A와 B에서 앵커된 위치 쌍을 확인합니다.
본 논문에서는 제시된 알고리즘이 거의 최적임을 증명하고, ˜O(n2/3/d1/6−o(1)) 시간 복잡도를 달성함을 보여줍니다. 여기서 n은 입력 문자열의 인코딩된 길이이고, ˜n은 디코딩된 길이이며, d는 최장 공통 부분 문자열의 인코딩된 길이입니다. 또한, 저자들은 prefix-sum oracle이 있는 경우 LCS-RLEp 문제에 대한 질의 복잡도에 대한 일치하는 하한 ˜Ω(n2/3/d1/6)를 증명합니다.
마지막으로, 저자들은 제시된 알고리즘을 약간 수정하여 RLE 문자열에 대한 최장 반복 부분 문자열 문제를 해결하는 데에도 적용할 수 있음을 보여줍니다.
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Wichtige Erkenntnisse aus
by Tzu-Ching Le... um arxiv.org 11-06-2024
https://arxiv.org/pdf/2411.02421.pdfTiefere Fragen