다국어 번역 모델의 디코더 표현이 이중언어 번역 모델에 비해 일관적으로 더 낮은 등방성을 보이며, 이는 언어별 정보를 모델링하는 데 많은 표현 용량을 사용하기 때문인 것으로 나타났다.