核心概念
大規模言語モデルを使用して、プログラミング課題の論理的エラーに対するフィードバックラダーを自動生成することができる。
要約
本研究では、大規模言語モデルであるGPT-4を使用して、プログラミング課題の論理的エラーに対するフィードバックラダーを自動生成する手法を提案している。フィードバックラダーとは、同じ問題に対する学生の提出に対して、段階的に詳細なフィードバックを提供するものである。
具体的には以下のようなフィードバックレベルを定義している:
レベル0: 正解/不正解のみを示す
レベル1: 失敗するテストケースを提示する
レベル2: 論理的なエラーの高レベルな説明を行う
レベル3: エラーが発生している場所を示す
レベル4: コードの修正箇所を具体的に示す
ユーザ評価実験の結果、以下のような傾向が観察された:
レベルが上がるほど、生成されたフィードバックの関連性と有効性が低下する
低スコアの提出に対するフィードバックの方が、高スコアの提出に対するフィードバックよりも良質である
これらの結果から、本手法はプログラミング初学者向けのフィードバックを生成することができるが、上級者向けのフィードバックの生成には課題があることが分かった。今後の課題として、より高度なフィードバックの生成や、学生の理解度に応じたパーソナライズされたフィードバックの生成などが考えられる。
統計
入力: a = 5, b = 6
期待出力: 20
実際の出力: 11
引用
"レベル4のフィードバックでは、学生の書いたバグのある プログラムを修正するための具体的な変更点を示すが、これは学生の学習にあまり効果的ではない。"