Core Concepts
多様なLLMエージェントを活用することで、教師の数学内容知識を効率的かつ正確に評価できる。
Abstract
本研究では、数学教師の内容知識(CK)を自動的に評価するためのLLMベースの多エージェントフレームワーク「LLMAgent-CK」を提案した。
管理者エージェント(AA)が入力データを前処理し、複数の評価者エージェント(AJ)に配布する。
AJはそれぞれ独立に教師の回答を評価し、到達した学習目標を判断する。
批判者エージェント(AC)が AJの評価結果を集約し、合意に達するまで議論を促す。
実験では、LLMAgent-CKが教師の数学CKを高精度(最大95.83%の精度)で特定できることを示した。
ケーススタディでは、多エージェントの議論プロセスが単一モデルよりも優れた結果を生み出すことを確認した。
本手法は、教師の内容知識を自動的かつ正確に評価し、効果的な教師研修プログラムの実現に貢献できる。
Stats
6人の労働者で7時間で1軒の家を塗ることができる。
12人の労働者で3.5時間で1軒の家を塗ることができる。
Quotes
"教師の数学内容知識(CK)は非常に重要であり、教師研修プログラムに不可欠である。"
"現在の自動CK特定手法には課題がある。例えば、ユーザー回答の多様性、高品質な注釈データの不足、予測の解釈性の低さなどである。"