이 연구는 다국어 언어 모델의 언어 간 지식 정렬 수준을 체계적으로 평가하고, 다국어 사전 학습과 지시 미세 조정이 이에 미치는 영향을 분석했다.
주요 결과는 다음과 같다:
현재 다국어 언어 모델의 언어 간 지식 정렬 수준은 전반적으로 만족스럽지 않다. 이들은 영어와 비영어 언어 간 기본 능력과 지식 성능의 불균형을 보이며, 높은 언어 간 일관성에도 불구하고 실제 지식 전달 능력은 낮다.
혼합 다국어 사전 학습은 다양한 언어의 기본 능력, 지식 성능 및 일관성을 향상시키지만, 특정 언어에 대한 집중 학습은 다른 언어의 성능을 저하시킨다. 그러나 이 두 가지 방법 모두 언어 간 지식 전달 능력을 크게 향상시키지 못한다.
다국어 지시 미세 조정은 특정 언어의 기본 능력을 향상시키고 지식 성능 저하를 완화시키지만, 언어 간 일관성과 지식 전달 능력 향상에는 크게 기여하지 못한다.
이 결과는 현재 다국어 언어 모델의 언어 간 지식 정렬 수준이 여전히 낮으며, 이를 개선하기 위해서는 새로운 접근 방식이 필요함을 시사한다.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Changjiang G... lúc arxiv.org 04-09-2024
https://arxiv.org/pdf/2404.04659.pdfYêu cầu sâu hơn