MathScaleは、人間の数学的学習における認知メカニズムに着想を得て、新しい数学問題を生成するためにトピックと知識ポイントから概念グラフを構築します。MathScaleQAデータセットは、2百万の数学問題-回答ペアを含み、LLMsの数学的推論能力を効果的に評価します。MathScale-7BはMWPBENCHで最先端のパフォーマンスを達成しました。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Zhengyang Ta... lúc arxiv.org 03-06-2024
https://arxiv.org/pdf/2403.02884.pdfYêu cầu sâu hơn