본 연구는 임베딩 기반 공간 키워드 쿼리 처리를 위한 효율적인 인덱싱 기법을 제안한다.
첫째, 경량화되고 효과적인 관련성 모델을 개발하였다. 이 모델은 텍스트 관련성, 공간 관련성, 그리고 가중치 학습 모듈로 구성된다. 텍스트 관련성은 듀얼 인코더 모듈을 통해 계산되며, 공간 관련성은 학습 기반의 새로운 모듈을 통해 학습된다. 가중치 학습 모듈은 텍스트 관련성과 공간 관련성의 최적 가중치를 결정한다.
둘째, 기계 학습 기반의 근사 최근접 이웃 탐색 인덱스를 개발하였다. 이 인덱스는 관련 쿼리와 객체를 함께 클러스터링하고 분리하는 새로운 학습 기반 클러스터링 기법을 활용한다. 또한 유사도 레이블 생성을 위한 새로운 의사 레이블 생성 기법을 제안하였다.
실험 결과, 제안된 LIST 솔루션은 기존 최신 기법들에 비해 효과성 측면에서 최대 19.21%와 12.79%의 성능 향상을 보였으며, 효율성 측면에서는 가장 효과적인 기준 대비 3배 빠른 성능을 보였다.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Ziqi Yin,Sha... lúc arxiv.org 03-13-2024
https://arxiv.org/pdf/2403.07331.pdfYêu cầu sâu hơn