MEDIT은 문법 오류 수정, 텍스트 단순화, 문장 바꾸기 등 3가지 텍스트 편집 작업을 아라비아어, 중국어, 영어, 독일어, 일본어, 한국어, 스페인어 등 7개 언어로 수행할 수 있는 다국어 모델이다.
MEDIT 모델은 다국어 대규모 사전 훈련 언어 모델을 지침 튜닝하여 구축되었다. 사용자가 자연어로 작성한 편집 지침을 입력받아 해당 지침에 맞게 텍스트를 편집할 수 있다.
실험 결과, MEDIT 모델은 다국어 텍스트 편집 벤치마크에서 우수한 성능을 보였으며, 특히 새로운 언어로의 일반화 능력이 뛰어난 것으로 나타났다. 또한 모델 크기 증가에 따른 성능 향상이 관찰되었다.
사람 평가 결과에서도 MEDIT 모델의 출력물이 대부분의 언어에서 유창성, 적절성, 정확성 측면에서 우수한 것으로 나타났다. 다만 아랍어의 경우 상대적으로 낮은 성능을 보였다.
To Another Language
from source content
arxiv.org
Дополнительные вопросы