ดาวน์โหลด Linnk AI
•
ผู้ช่วยวิจัย
>
ลงชื่อเข้าใช้
ข้อมูลเชิงลึก
-
大規模言語モデル評価、数学的推論ベンチマーク、オリンピックレベルの数学問題
大規模言語モデルのための普遍的なオリンピックレベルの数学ベンチマーク:Omni-MATH
最新の言語モデルは従来の数学的推論ベンチマークではもはや十分に評価できないレベルに達しており、より難易度の高いオリンピックレベルの数学問題に特化したベンチマークと評価手法が必要とされている。
1