Core Concepts
영어 데이터만으로 학습한 대규모 언어 모델도 다국어 지시 따르기 능력을 보유할 수 있지만, 정확성과 유창성 면에서 한계가 있다.
Abstract
이 연구는 영어 데이터만으로 학습한 대규모 언어 모델의 다국어 지시 따르기 능력을 체계적으로 분석했다. 주요 결과는 다음과 같다:
영어 데이터만으로 학습한 모델도 다국어 지시 따르기 능력을 보유할 수 있지만, 정확성과 유창성이 영어에 비해 낮다.
모델 크기, 학습 데이터 크기, 하이퍼파라미터 튜닝 등이 다국어 성능에 중요한 영향을 미친다.
영어 중심 모델은 다국어 지시에 대해 대체로 적절한 언어로 응답을 생성할 수 있지만, 사실성이 낮고 가끔 유창성 오류가 발생한다.
다국어 데이터로 사전 학습한 모델이나 다국어 데이터로 추가 학습한 모델이 다국어 성능이 더 좋다.
다국어 지시 따르기 평가 시 다양한 측면(언어 정확성, 유창성, 사실성 등)을 고려해야 한다.
Stats
영어 데이터로 학습한 모델의 다국어 지시 따르기 정확성 점수는 1.46/2.0이다.
영어 데이터로 학습한 모델의 다국어 지시 따르기 유창성 점수는 1.29/2.0이다.
영어 데이터로 학습한 모델의 다국어 지시 따르기 사실성 점수는 1.34/2.0이다.
Quotes
"영어 데이터만으로 학습한 모델도 다국어 지시 따르기 능력을 보유할 수 있지만, 정확성과 유창성이 영어에 비해 낮다."
"다국어 데이터로 사전 학습한 모델이나 다국어 데이터로 추가 학습한 모델이 다국어 성능이 더 좋다."