Core Concepts
人間の知能の基本的な認知能力を評価するための数学的推論は、大規模言語モデル(LLMs)の自動化解決に向けて急速に進化しているが、この分野での真の進歩と障害を理解することは困難である。
Abstract
数学的推論の重要性とLLMsの発展に焦点を当てた総説。
4つの主要な次元に焦点を当て、様々な数学問題やそれに関連するデータセット、LLMsが数学問題解決に使用される技術、影響を受ける要因や懸念、およびこの分野で残存する挑戦について探求。
メソッド論、プロンプト凍結LLMs、凍結LLMsを強化する戦略、LLMsを微調整する3つの段階にまとめられる。
数値表現や方程式生成などさまざまな方法が紹介されており、教育への適用や将来への展望も含まれている。
Quotes
"Mathematical reasoning serves as a cornerstone for assessing the fundamental cognitive capabilities of human intelligence."
"This survey endeavors to cast a spotlight on the multifaceted landscape of LLMs in the realm of mathematics."
"The lack of a unified framework hampers our ability to gauge the true extent of progress achieved and impedes a coherent understanding of the challenges that persist in this evolving field."