Core Concepts
学生の教育評価を分析するための新しい方法を紹介し、大規模なデータセットからテーマを特定することが可能であることを示す。
Abstract
この論文では、自然言語処理(NLP)と大規模言語モデル(LLMs)を使用して学生の教育評価(SETs)を分析する新しい方法について議論しています。5,000件のSETsから抽出されたアイデアをクラスタリングし、コードブックを生成するプロセスが詳細に説明されています。さらに、人間が手動で行ったコーディング作業と比較した結果も提示されています。
情報抽出:
4,672件のSETから12,046個のアイデアが抽出されました。
平均3.3個のアイデアが抽出されました。
抽出されたアイデアは272個のクラスターにまとめられました。
クラスタリング:
12,046個の抽出された情報が272個のクラスターにまとめられました。
232個のコードからなるコードブックが生成されました。
コードブック簡略化:
232個のコードから159個へ簡略化されました。
コード品質や有用性に関する判断は人間エキスパートによって行われました。
Stats
"5,000 SETsから" - 大規模なSETsデータセット
"12,046個" - 抽出されたアイデア数
"272個" - クラスター数
"232個" - 初期コードブック内のコード数
Quotes
「この方法は、大規模なドキュメント群からテーマを特定する可能性がある」