大規模言語モデルは数学者の仕事を支援する強力なツールとなる可能性がある。しかし、現在のモデルにはまだ限界があり、数学的推論の自動化には至っていない。数学者とAIの協調が重要である。
大規模言語モデルは数学の複雑な問題解決において依然として課題を抱えている。本研究では、数学スタックエクスチェンジの多様な数学問題に対する大規模言語モデルの性能を評価し、その限界と課題を明らかにする。