본 논문에서는 다양한 문자열 유사성 측정값(특히 편집 거리와 인델 거리) 간의 관계를 조사하고, 문자열을 더 작은 알파벳(이진 알파벳 포함)으로 임베딩하면서 거리를 보존하는 방법을 중점적으로 다룹니다.