다국어 비전-언어 모델의 성능을 향상시키기 위해 어휘 확장, 다국어 사전 학습, 다국어 비전 지시 학습 등의 방법을 제안하고 이를 통해 구축한 X-LLaVA 모델이 기존 모델 대비 우수한 성능을 보임.