Core Concepts
言語モデルを使用して教育用数学の単語問題を自動生成する方法に焦点を当てる。
Abstract
MATHWELLは、専門家の注釈データを使用してK-8数学の単語問題を生成するLlama-2(70B)モデルであり、20,490問題の英語単語問題データセットを生成します。MATHWELLは、他の代替手段よりも40%高い割合で実行可能な解決策とすべての基準を満たす問題を持っていることが示されています。さらに、SGSMは他のデータセットよりも年齢適切な読解レベルを持っています。これにより、MATHWELLは高品質で複雑な問題を生成し、教育的な価値があることが示されます。
Stats
MATHWELLは40%以上の問題が実行可能な解決策とすべての基準を満たすことが示されています。
SGSMTrainサブセットには2,093件のMaC(全基準を満たす)サンプルが含まれています。
MATHWELLは平均して最も多くの異なる操作/トピック数を持つ質問を生成しています。
Quotes
"Existing datasets are unlabelled for solvability, accuracy, and appropriateness, making them ill-suited for training problem generators."
"We propose context-free educational math word problem generation with three main criteria: solvability, accuracy, and appropriateness."
"MATHWELL is the first context-free educational math word problem generator."