核心概念
本稿では、複雑な数学的視覚化を自動生成するマルチエージェントフレームワーク「VISTA」を提案する。LLMを活用し、正確な図形やグラフを生成するだけでなく、問題文との整合性を保ち、数学的概念の理解を深めることを目指す。
要約
VISTA:LLMを用いた数学の問題生成における調整可能な自動化のための視覚統合システム
本稿は、LLMを用いて数学の問題と視覚教材を自動生成するマルチエージェントフレームワーク「VISTA」を提案する研究論文である。
数学教育において、幾何学的形状や関数などの視覚表現は、生徒の理解を深める上で重要な役割を果たす。しかし、正確で一貫性のある視覚教材を手動で作成することは、時間と労力がかかる作業である。本研究は、LLMを活用することで、数学の問題文と視覚教材の生成を自動化し、教育者の負担を軽減することを目的とする。
VISTAは、それぞれが数値計算、幾何学的検証、関数検証、視覚化、コード実行、数学的問題生成、数学的要約などの特定のタスクを担当する7つのエージェントで構成されている。
数値計算エージェント: GeoQA、Geometry3K、GEOSなどのデータセットを入力クエリとして使用し、座標計算、線分長の測定、角度計算、面積と周囲長の計算などのタスクを実行する。
幾何学的検証エージェント: 生成された幾何学的形状が、問題の指定された制約に準拠しているかどうかを検証する。
関数検証エージェント: 与えられた条件下で幾何学的形状を分析および検証する。
ビジュアライザーエージェント: 幾何学的形状を正確に視覚化するコードを生成する。
コード実行エージェント: ビジュアライザーによって生成されたコードを実行し、幾何学的形状の視覚表現を生成する。
数学的問題生成エージェント: 生成された画像に基づいて、多肢選択問題や自由形式問題などの対応する問題を作成する。
要約エージェント: 他のすべてのエージェントからの結果を統合し、最終結果がエラーなしで問題の要件を満たしていることを保証する。
本研究では、Claude 3.5 Sonnetをフレームワークのコアモデルとして使用し、AutoGenを用いてマルチエージェントフレームワークを実装した。評価には、GPT-4 omni (GPT-4o) を使用し、生成された画像と元の画像の類似性を評価した。