이 논문은 저자 자원이 부족한 언어의 교차 언어 문장 임베딩을 향상시키기 위한 새로운 프레임워크를 제안한다. 현재 교차 언어 문장 임베딩 모델은 저자 자원이 부족한 언어의 단어 수준 정렬이 잘 이루어지지 않는 문제가 있다. 이를 해결하기 위해 저자는 단어 정렬 모델을 활용하여 단어 수준의 정렬을 명시적으로 수행하는 WACSE(Word Aligned Cross-lingual Sentence Embedding) 프레임워크를 제안한다.
WACSE 프레임워크는 다음 세 가지 목표를 통해 구현된다:
실험 결과, WACSE 프레임워크는 저자 자원이 부족한 언어의 교차 언어 문장 임베딩 성능을 크게 향상시켰다. 또한 다양한 고자원 언어 작업에서도 경쟁력 있는 성능을 보였다.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Zhongtao Mia... a las arxiv.org 04-04-2024
https://arxiv.org/pdf/2404.02490.pdfConsultas más profundas