本研究では、高校数学のNCERT教科書から収集した数学問題データセット「MathQuest」を紹介する。このデータセットには、さまざまな複雑度の数学問題が含まれている。
研究では、LLaMA-2、WizardMath、MAmmoTHの3つの大規模言語モデルを使用して、MathQuestデータセットでの微調整実験を行った。その結果、MAmmoTH-13Bモデルが最も優れた数学問題解決能力を示した。したがって、MAmmoTH-13Bは、NCERT数学問題に対する堅牢で信頼できるベースラインとなる。
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문