Conceitos Básicos
대규모 언어 모델을 활용하여 에스토니아어 이해 및 생성 능력을 향상시키는 방법을 제안한다. 특히 교차 언어 지식 전이와 추가 단일어 사전 학습을 통해 성능을 개선할 수 있음을 보여준다.
Resumo
이 논문은 대규모 언어 모델(LLM)을 활용하여 에스토니아어 이해 및 생성 능력을 향상시키는 방법을 제안한다. 주요 내용은 다음과 같다:
- Llama 2 모델을 활용하여 교차 언어 지시 학습과 추가 단일어 사전 학습의 효과를 실험했다.
- 단일어 사전 학습 후 교차 언어 지시 학습을 수행하면 에스토니아어 성능이 크게 향상됨을 확인했다.
- 고품질 영어 지시문을 활용하여 에스토니아어 성능을 추가로 향상시킬 수 있음을 보였다. 이는 영어에서 에스토니아어로의 긍정적인 지식 전이를 보여준다.
- 이를 통해 LLAMMAS라는 최초의 오픈소스 에스토니아어 지시 따르기 LLM을 개발했다.
- 또한 Alpaca-est라는 에스토니아어 일반 과제 지시 데이터셋을 공개했다.
이 연구는 에스토니아어 LLM 개발을 위한 초기 진전을 나타낸다.
Estatísticas
에스토니아어 질문 답변 과제에서 Llama-2-7B 모델에 1B 토큰의 추가 사전 학습을 수행하면 성능이 81%에서 82%로 향상된다.
에스토니아어-영어 기계 번역 과제에서 LLAMMAS-MT 모델은 BLEU 점수 26.9를 달성한다.
에스토니아어 문법 오류 정정 과제에서 LLAMMAS-MT 모델은 F0.5 점수 61.2를 달성한다.
Citações
"단일어 사전 학습 후 교차 언어 지시 학습을 수행하면 에스토니아어 성능이 크게 향상됨을 확인했다."
"고품질 영어 지시문을 활용하여 에스토니아어 성능을 추가로 향상시킬 수 있음을 보였다."
"이를 통해 LLAMMAS라는 최초의 오픈소스 에스토니아어 지시 따르기 LLM을 개발했다."