이 연구는 문서 재순위화를 위한 크로스 인코더의 효율성을 높이기 위해 희소 주의 집중 기법을 탐구한다. 기존 연구에서는 윈도우 기반 자기 주의 집중을 적용하여 효율성을 높였지만, 윈도우 크기가 성능에 미치는 영향과 토큰 간 상호작용이 필요한지에 대해서는 자세히 분석하지 않았다.
이 연구에서는 다음과 같은 가설을 바탕으로 실험을 진행했다:
실험 결과, 윈도우 크기를 4로 줄이거나 쿼리 토큰에서 문서 토큰으로의 주의 집중을 비활성화해도 성능 저하가 크지 않았다. 이를 통해 토큰 상호작용을 크게 줄일 수 있었고, 메모리 사용량은 최대 59%, 추론 속도는 최대 43% 향상되었다.
이 연구는 문서 재순위화를 위한 크로스 인코더의 효율성을 크게 높일 수 있는 새로운 희소 주의 집중 패턴을 제안했다. 향후 연구에서는 이 패턴을 퓨전 주의 집중 커널에 통합하여 추가적인 효율성 향상을 모색할 계획이다.
To Another Language
from source content
arxiv.org
Önemli Bilgiler Şuradan Elde Edildi
by Ferd... : arxiv.org 03-21-2024
https://arxiv.org/pdf/2312.17649.pdfDaha Derin Sorular