Centrala begrepp
対話型チューターとの数学対話における学生の発話内容を分析することで、学生の知識レベルを推定し、具体的な誤解を明らかにすることができる。
Sammanfattning
本研究は、対話型チューターとの数学対話における知識追跡(KT)の新しい試みを提示している。
まず、事前学習済みの大規模言語モデル(LLM)を使用して、対話の各ターンに関連する知識要素(KC)と学生の発話の正誤を自動的に注釈する手法を提案した。
次に、この注釈データを使用して、LLMベースのKT手法(LLMKT)と、テキストの意味的特徴を活用したDKT-Semを開発した。
実験の結果、LLMKTは既存のKT手法と比べて大幅に優れた性能を示した。特に、データが少ない場合でも高い精度を達成できることが分かった。
さらに、定性的分析とラーニングカーブの可視化を通して、LLMKTが意味のある知識状態の推定を学習できることを示した。
最後に、GPT-4oによる対話の注釈の精度が専門家の評価と概ね一致することを確認した。
Statistik
学生の発話が正解の割合は、CoMTAデータセットで57.78%、MathDialデータセットで49.86%である。
CoMTAデータセットには164種類の知識要素(KC)が含まれており、1つの対話あたり平均3.20種類のKCが関連付けられている。
MathDialデータセットには145種類のKCが含まれており、1つの対話あたり平均4.16種類のKCが関連付けられている。
CoMTAデータセットの58.75%、MathDialデータセットの82.89%の発話ターンに2つ以上のKCが関連付けられている。
Citat
"学生の発話内容を分析することで、学生の知識レベルを推定し、具体的な誤解を明らかにすることができる。"
"LLMKTは既存のKT手法と比べて大幅に優れた性能を示した。特に、データが少ない場合でも高い精度を達成できる。"
"LLMKTが意味のある知識状態の推定を学習できることを示した。"