이 연구에서는 다국어 뉴스 추천을 위한 새로운 공개 데이터셋 xMIND를 소개한다. xMIND는 영어 MIND 데이터셋을 기계 번역하여 언어, 지리, 자원 수준이 다양한 14개 언어로 구성된다. 이를 통해 다국어 및 교차 언어 뉴스 추천 모델의 성능을 체계적으로 평가한다. 실험 결과, 현재의 뉴스 추천 모델은 영어 기반 모델을 다른 언어에 적용할 경우 상당한 성능 저하를 겪으며, 타겟 언어 데이터를 추가로 활용하더라도 이를 효과적으로 극복하기 어려운 것으로 나타났다. 이는 다국어 및 교차 언어 뉴스 추천에 대한 더 광범위한 연구가 필요함을 시사한다.
Til et annet språk
fra kildeinnhold
arxiv.org
Viktige innsikter hentet fra
by Andr... klokken arxiv.org 03-27-2024
https://arxiv.org/pdf/2403.17876.pdfDypere Spørsmål