본 논문은 다중 벡터 밀집 검색의 효율성을 높이기 위한 EMVB 프레임워크를 제안한다.
비트 벡터 기반의 효율적인 문서 사전 필터링 단계를 도입하여 후속 처리 단계의 비용을 크게 줄였다. 이를 통해 상위 nprobe 중심점 추출 비용이 크게 감소했다.
중심점 상호작용 계산을 열 단위 SIMD 감소 기법으로 효율화했다. 이를 통해 중심점 상호작용 단계의 지연 시간을 크게 줄였다.
프로덕트 양자화(PQ)를 활용하여 벡터 표현 저장을 위한 메모리 사용량을 줄이면서도 빠른 후기 상호작용을 가능하게 했다.
PQ와 문서 단위 용어 필터링을 결합하여 후기 상호작용 단계의 효율성을 추가로 향상시켰다.
실험 결과, EMVB는 PLAID 대비 최대 2.8배 빠르면서도 1.8배 적은 메모리를 사용하면서도 검색 정확도 저하 없이 우수한 성능을 보였다. 또한 도메인 외 데이터셋에서도 최대 2.9배 빠른 성능을 보였다.
На другой язык
из исходного контента
arxiv.org
Дополнительные вопросы