이 논문은 저지연 검색을 위한 Cross-Encoder 모델의 효율성과 효과성에 대해 다룹니다.
먼저, Cross-Encoder 모델은 쿼리와 문서를 동시에 인코딩하여 관련성을 평가하지만, 이로 인해 계산 복잡도가 높아져 지연 시간이 증가하는 문제가 있습니다. 이에 반해 Bi-Encoder 모델은 쿼리와 문서를 별도로 인코딩하여 관련성을 평가하므로 지연 시간이 낮지만, 효과성이 떨어집니다.
이 논문에서는 얕은 Cross-Encoder 모델(레이어 수가 적은 Cross-Encoder)이 지연 시간이 제한된 상황에서 더 나은 성능을 보인다는 가설을 제시합니다. 이는 얕은 모델이 더 많은 문서를 빠르게 평가할 수 있기 때문입니다.
또한 이 논문은 얕은 Cross-Encoder 모델의 학습을 위해 증가된 수의 부정적 샘플과 일반화된 이진 교차 엔트로피 손실 함수를 사용하는 방법을 제안합니다. 실험 결과, 이 방법이 얕은 모델의 성능을 향상시키는 것으로 나타났습니다.
마지막으로 CPU 추론을 사용한 얕은 Cross-Encoder 모델의 성능을 분석하였는데, GPU 추론 대비 약간의 성능 저하가 있지만 여전히 효과적인 것으로 나타났습니다. 이는 GPU 없이도 Cross-Encoder 모델을 실용적으로 사용할 수 있음을 보여줍니다.
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問