本研究では、高校数学のNCERT教科書から収集した数学問題データセット「MathQuest」を紹介する。このデータセットには、さまざまな複雑度の数学問題が含まれている。
研究では、LLaMA-2、WizardMath、MAmmoTHの3つの大規模言語モデルを使用して、MathQuestデータセットでの微調整実験を行った。その結果、MAmmoTH-13Bモデルが最も優れた数学問題解決能力を示した。したがって、MAmmoTH-13Bは、NCERT数学問題に対する堅牢で信頼できるベースラインとなる。
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Avinash Anan... alle arxiv.org 04-23-2024
https://arxiv.org/pdf/2404.13099.pdfDomande più approfondite