시각적 자기회귀 모델링(VAR)은 기존 자기회귀 모델의 한계를 극복하고 이미지 생성 성능을 크게 향상시킨다. VAR은 이미지를 다중 스케일 토큰 맵으로 인코딩하고, 이를 자기회귀적으로 예측하는 새로운 패러다임을 제시한다. 이를 통해 VAR은 언어 모델 기반 자기회귀 모델이 강력한 확산 모델을 처음으로 능가하는 성과를 달성했다.