이 논문은 저자 자원이 부족한 언어의 교차 언어 문장 임베딩을 향상시키기 위한 새로운 프레임워크를 제안한다. 현재 교차 언어 문장 임베딩 모델은 저자 자원이 부족한 언어의 단어 수준 정렬이 잘 이루어지지 않는 문제가 있다. 이를 해결하기 위해 저자는 단어 정렬 모델을 활용하여 단어 수준의 정렬을 명시적으로 수행하는 WACSE(Word Aligned Cross-lingual Sentence Embedding) 프레임워크를 제안한다.
WACSE 프레임워크는 다음 세 가지 목표를 통해 구현된다:
실험 결과, WACSE 프레임워크는 저자 자원이 부족한 언어의 교차 언어 문장 임베딩 성능을 크게 향상시켰다. 또한 다양한 고자원 언어 작업에서도 경쟁력 있는 성능을 보였다.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Zhongtao Mia... alle arxiv.org 04-04-2024
https://arxiv.org/pdf/2404.02490.pdfDomande più approfondite