본 연구는 다국어 언어 모델링을 위한 새로운 바이트 인코딩 방법인 MYTE를 제안한다. MYTE는 언어 간 균형 잡힌 문자열 길이와 향상된 언어 모델링 성능을 달성한다.
본 연구는 형태론 기반 바이트 인코딩 기법(MYTE)을 제안하여, 다양한 언어에 걸쳐 균형 잡힌 텍스트 표현을 달성하고 다국어 언어 모델링 성능을 향상시킨다.