Linnk AI 다운로드
•
리서치 어시스턴트
>
로그인
통찰
-
大規模言語モデル評価、数学的推論ベンチマーク、オリンピックレベルの数学問題
大規模言語モデルのための普遍的なオリンピックレベルの数学ベンチマーク:Omni-MATH
最新の言語モデルは従来の数学的推論ベンチマークではもはや十分に評価できないレベルに達しており、より難易度の高いオリンピックレベルの数学問題に特化したベンチマークと評価手法が必要とされている。
1