기계 번역 목적이 교차 언어 표현 학습을 향상시키지 않는다는 것을 발견했다. 이는 기계 번역에 유리한 출력 분리가 다른 곳에서는 해롭기 때문이다.
다국어 언어 모델의 제로샷 교차 언어 전이 능력은 잘 알려져 있지만, 긍정적 또는 부정적 전이 현상과 언어 선택의 영향은 아직 완전히 이해되지 않고 있다. 우리는 어댑터 유닛을 사용하여 작업과 언어를 분리함으로써 특정 전이 언어가 다른 대상 언어의 성능에 미치는 영향을 효율적으로 연구하는 방법을 제안한다.
대규모 언어 모델의 교차 언어 전이 능력을 향상하기 위해서는 사전 훈련 전에 다국어 정렬을 구축하고, 훈련 과정 전반에 걸쳐 이를 유지하는 것이 중요하다.