이 논문은 밀집 검색기의 타이포 오류에 대한 강인성을 높이는 방법을 제안한다. 기존 연구에서는 타이포 오류가 있는 쿼리를 학습 데이터로 활용하고, 추가적인 강인화 보조 작업을 수행하여 원본 쿼리와 타이포 오류가 있는 쿼리 간의 표현 차이를 최소화하는 방식을 사용했다. 그러나 이러한 방식은 쿼리당 하나의 긍정 샘플만을 사용하는 대조 학습을 활용했다.
본 연구에서는 쿼리당 여러 개의 타이포 오류 변형이 존재한다는 점에 주목하여, 이를 모두 활용하는 다중 긍정 대조 학습 방식을 제안한다. 실험 결과, 제안 방식은 기존 단일 긍정 대조 학습 방식에 비해 타이포 오류에 대한 강인성이 향상되는 것을 확인했다. 특히 쿼리 검색 보조 작업에서 다중 긍정 대조 학습을 적용한 경우 성능 향상이 두드러졌다.
To Another Language
from source content
arxiv.org
Principais Insights Extraídos De
by Georgios Sid... às arxiv.org 03-19-2024
https://arxiv.org/pdf/2403.10939.pdfPerguntas Mais Profundas