Last ned Linnk AI
•
Forskningsassistent
>
Logg Inn
innsikt
-
고차원 추론 및 지름길 학습 평가를 위한 MMLU-Pro+ 벤치마크
다양한 정답 선택지를 통한 고차원 추론 및 지름길 학습 평가: MMLU-Pro+ 소개
MMLU-Pro+는 다중 정답 선택지를 도입하여 언어 모델의 고차원 추론 능력과 지름길 학습 경향을 평가하는 새로운 벤치마크이다.
1