แนวคิดหลัก
본 논문에서는 검색 시스템에서 널리 사용되는 기존의 내적 기반 유사도 함수를 뛰어넘어, 향상된 표현력과 효율성을 제공하는 학습된 유사도 함수(MoL) 기반의 새로운 검색 기술을 제안합니다.
บทคัดย่อ
학습된 유사도 기반 검색: MoL 기반 접근 방식
본 연구 논문에서는 대규모 코퍼스에서 관련 항목을 효율적으로 검색하는 데 널리 사용되는 기존의 내적 기반 유사도 함수의 한계점을 지적하고, 이를 극복하기 위해 학습된 유사도 함수를 활용한 새로운 검색 기술을 제안합니다.
기존 검색 기술의 한계점
기존의 최대 내적 검색(MIPS) 알고리즘은 내적 기반 유사도 함수를 사용하여 효율적인 검색을 가능하게 했습니다. 그러나 최첨단 검색 알고리즘은 여러 쿼리 임베딩, 복잡한 신경망, 빔 검색을 통한 직접 항목 ID 디코딩 및 하이브리드 솔루션을 포함하는 학습된 유사도로 전환되었습니다. 불행히도 이러한 최첨단 설정에서 검색을 위한 효율적인 솔루션은 부족한 실정입니다.
MoL 기반 검색 기술 제안
본 연구에서는 표현력이 뛰어난 학습된 유사도 함수를 사용하여 효율적인 검색 기술을 조사합니다. 구체적으로, MoL(Mixture-of-Logits)을 유사도 함수의 범용 근사기로 설정하고, MoL의 표현력을 통해 다양한 검색 시나리오에서 우수한 성능을 달성할 수 있음을 보여줍니다. 또한 MoL을 사용하여 근접 상위-K 결과를 검색하기 위한 기술과 엄격한 오류 범위를 제안합니다.
MoL의 장점
- 표현력: MoL은 임의의 높은 순위의 p(x|q) 행렬을 표현할 수 있는 범용 근사기이므로 모든 학습된 유사도 함수를 근사할 수 있습니다.
- 효율성: MoL은 상위-K 쿼리와 같은 벡터 데이터베이스의 기존 API를 활용하여 MIPS와 같은 효율적인 벡터 검색에 대한 이전 연구의 이점을 활용합니다.
- 성능: MoL은 추천 시스템의 순차적 검색 모델 및 질문 답변을 위한 언어 모델 미세 조정을 포함한 이기종 시나리오에서 최첨단 결과를 설정합니다.
- 확장성: MoL 기반의 근접 상위-K 검색 알고리즘은 정확한 알고리즘에 비해 최대 66배 빠른 지연 시간을 제공하면서 0.99 이상의 재현율을 달성합니다.
결론
본 연구는 벡터 데이터베이스에서 광범위하게 채택된 MIPS 솔루션에서 GPU에서 학습된 유사도를 사용한 검색(RAILS)으로 마이그레이션해야 함을 강력하게 뒷받침합니다. MoL은 높은 산술 강도로 인해 최신 가속기를 효율적으로 활용하여 MIPS 수준의 추론 지연 시간과 처리량을 제공합니다.
สถิติ
MoL은 추천 시스템에서 HR@1에서 평균 29.1%, HR@10에서 16.3%, MRR에서 18.1%까지 기존 최첨단 밀집 검색 기준(내적)을 능가합니다.
MoL은 Natural Questions QA 데이터 세트에서 모든 최신 생성 검색 접근 방식과 강력한 밀집 및 희소 검색 기준을 능가합니다.
제안된 상호 정보 기반 로드 밸런싱 손실(LMI)은 네 가지 데이터 세트에서 HR@1을 2.4%, HR@10을 0.8%, MRR을 1.4% 향상시킵니다.
근접 상위-K 검색 알고리즘은 정확한 알고리즘에 비해 최대 66배 빠른 지연 시간을 제공하면서 0.99 이상의 재현율을 달성합니다.
คำพูด
"Taking a step back, our key insight is that learned similarity approaches are but different ways to increase the expressiveness of the retrieval stage."
"To the best of our knowledge, this is the first work that tackles the problem of efficient retrieval with universal learned similarities, while setting new state-of-the-art results across heterogeneous scenarios."
"Our work provides strong theoretical and practical justifications to migrate away from the broadly adopted MIPS solution in vector databases to Retrieval with Learned Similarities (RAILS) on GPUs."