Pobierz Linnk AI
•
Asystent Badawczy
>
Zaloguj się
spostrzeżenie
-
大規模言語モデル評価、数学的推論ベンチマーク、オリンピックレベルの数学問題
大規模言語モデルのための普遍的なオリンピックレベルの数学ベンチマーク:Omni-MATH
最新の言語モデルは従来の数学的推論ベンチマークではもはや十分に評価できないレベルに達しており、より難易度の高いオリンピックレベルの数学問題に特化したベンチマークと評価手法が必要とされている。
1