本研究では、高校数学のNCERT教科書から収集した数学問題データセット「MathQuest」を紹介する。このデータセットには、さまざまな複雑度の数学問題が含まれている。
研究では、LLaMA-2、WizardMath、MAmmoTHの3つの大規模言語モデルを使用して、MathQuestデータセットでの微調整実験を行った。その結果、MAmmoTH-13Bモデルが最も優れた数学問題解決能力を示した。したがって、MAmmoTH-13Bは、NCERT数学問題に対する堅牢で信頼できるベースラインとなる。
翻译成其他语言
从原文生成
arxiv.org
更深入的查询