이 논문은 생성 검색(GR)과 다중 벡터 밀집 검색(MVDR) 간의 관계를 분석한다.
GR의 디코더 구조를 분석하여 GR의 손실 함수가 MVDR의 프레임워크와 동일함을 보였다. 즉, GR은 문서 단어 임베딩, 질의 토큰 벡터, 그리고 정렬 행렬의 곱으로 문서-질의 관련성을 계산한다.
GR과 MVDR의 문서 인코딩 및 정렬 전략의 차이를 분석하였다. GR은 단순한 단어 임베딩을 사용하지만, PAWA 디코딩과 NP 디코딩을 통해 문맥화된 토큰 벡터를 활용할 수 있다. 또한 GR은 문서-질의 정렬을 사용하는 반면, MVDR은 질의-문서 정렬을 사용한다.
실험을 통해 GR과 MVDR 모두 정확한 용어 매칭을 선호하는 것을 확인했다. 또한 MVDR의 질의-문서 정렬이 재순위화 작업에서 더 나은 성능을 보였다.
이 연구는 GR 모델의 내부 메커니즘을 MVDR 프레임워크로 설명함으로써 GR과 MVDR의 관계를 깊이 있게 이해할 수 있게 한다. 이는 향후 새로운 검색 모델 개발에 도움이 될 것이다.
To Another Language
from source content
arxiv.org
Дополнительные вопросы