이 논문은 근사 최근접 이웃 검색(ANNS) 기법 중 하나인 E2LSH 알고리즘의 성능을 분석하고, 이를 바탕으로 스토리지 기반 E2LSH 구현(E2LSHoS)을 제안한다.
먼저 E2LSH 알고리즘의 계산 비용과 I/O 비용을 실험적으로 분석한다. 이를 통해 E2LSHoS가 소규모 인덱스 기반 방법들(SRS, QALSH)과 동등한 속도를 내기 위한 스토리지 성능 요구사항을 도출한다. 이는 단일 소비자급 NVMe SSD로도 달성할 수 있는 수준이다.
또한 E2LSHoS가 메모리 내 E2LSH 속도에 근접하기 위한 스토리지 성능 요구사항을 분석한다. 이는 최신 고성능 스토리지 기기와 I/O 인터페이스를 활용하면 달성할 수 있는 수준이다.
이를 바탕으로 E2LSHoS를 구현하고 다양한 스토리지 기기와 인터페이스를 사용하여 평가한다. 실험 결과, E2LSHoS는 소규모 인덱스 방법들보다 훨씬 빠른 속도를 보이며, 메모리 내 E2LSH 속도에 근접할 수 있음을 보여준다. 또한 데이터베이스 크기가 늘어나도 쿼리 시간이 서브 선형적으로 증가한다.
이를 통해 대용량 데이터베이스에서도 E2LSH와 같은 대규모 인덱스 기반 ANNS 방법이 다시 주목받을 수 있음을 시사한다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문