核心概念
大規模言語モデルは、複雑な数学問題を解決するための強力なツールとなる可能性がある。
要約
本研究では、高校数学のNCERT教科書から収集した数学問題データセット「MathQuest」を紹介する。このデータセットには、さまざまな複雑度の数学問題が含まれている。
研究では、LLaMA-2、WizardMath、MAmmoTHの3つの大規模言語モデルを使用して、MathQuestデータセットでの微調整実験を行った。その結果、MAmmoTH-13Bモデルが最も優れた数学問題解決能力を示した。したがって、MAmmoTH-13Bは、NCERT数学問題に対する堅牢で信頼できるベースラインとなる。
統計
数学問題データセット「MathQuest」には、11年生と12年生のNCERT教科書から収集された問題が含まれている。
データセットには、14の数学分野にわたる223の問題が含まれている。
「数列と級数」の分野が最も多くの問題を含んでいる。
引用
大規模言語モデルは、算術演算、代数的原理、記号操作の本質的な理解を活用して、数学的推論と問題解決に優れた能力を発揮する。
しかし、複雑な推論、多段階の算術計算、分野固有の知識を必要とする数学ワードプロブレムに取り組むには、依然として大きな課題がある。