EURUS는 대규모 언어 모델의 추론 능력을 향상시키기 위해 개발된 모델 및 데이터셋이다. ULTRAINTERACT는 복잡한 추론 과제를 위해 특별히 설계된 대규모 고품질 정렬 데이터셋으로, 선호도 학습을 통해 EURUS 모델의 성능을 크게 향상시켰다.