이 연구는 다국어 언어 모델의 언어 간 지식 정렬 수준을 체계적으로 평가하고, 다국어 사전 학습과 지시 미세 조정이 이에 미치는 영향을 분석했다.
주요 결과는 다음과 같다:
현재 다국어 언어 모델의 언어 간 지식 정렬 수준은 전반적으로 만족스럽지 않다. 이들은 영어와 비영어 언어 간 기본 능력과 지식 성능의 불균형을 보이며, 높은 언어 간 일관성에도 불구하고 실제 지식 전달 능력은 낮다.
혼합 다국어 사전 학습은 다양한 언어의 기본 능력, 지식 성능 및 일관성을 향상시키지만, 특정 언어에 대한 집중 학습은 다른 언어의 성능을 저하시킨다. 그러나 이 두 가지 방법 모두 언어 간 지식 전달 능력을 크게 향상시키지 못한다.
다국어 지시 미세 조정은 특정 언어의 기본 능력을 향상시키고 지식 성능 저하를 완화시키지만, 언어 간 일관성과 지식 전달 능력 향상에는 크게 기여하지 못한다.
이 결과는 현재 다국어 언어 모델의 언어 간 지식 정렬 수준이 여전히 낮으며, 이를 개선하기 위해서는 새로운 접근 방식이 필요함을 시사한다.
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor