Beckman, M.D., Burke, S., Fiochetta, J., Fry, B., Lloyd, S.E., Patterson, L., & Tang, E. (出版年不詳). Developing Consistency Among Undergraduate Graders Scoring Open-Ended Statistics Tasks.
本研究は、オープンエンド形式の統計タスクを採点する学部生の採点者チームが、トレーニングと経験を積むにつれて、採点の一貫性がどのように変化するかを調査することを目的とした。
経験豊富な統計学教員1名と、統計学またはデータサイエンスを専攻する学部生4名を対象に、計5回の採点演習を実施した。最初の演習では、解答例と口頭での指示のみによる「最小限の評価基準」を用いて採点を行った。2回目と3回目の演習では、採点者自身が作成した評価基準と、他の採点者が作成した評価基準を用いて採点を行った。4回目と5回目の演習では、研究者が作成した詳細な「専門家評価基準」を用いて採点を行った。5回目の演習は、4回目の演習から約10週間後に行った。採点の一貫性は、2つの評価基準間の一致度を測る指標であるQuadratic Weighted Kappa (QWK)を用いて評価した。
学部生の採点者と指導教員との間の採点の一貫性は、トレーニングと経験を積むにつれて向上した。「専門家評価基準」を用いた場合、学部生の採点者と指導教員との間のQWK値は、最初の演習では0.50~0.70程度であったが、最後の演習では0.70~0.80程度に向上した。また、学部生の採点者同士の採点の一貫性も、トレーニングと経験を積むにつれて向上した。
適切なトレーニングと質の高い評価基準を用いることで、学部生の採点者でも、オープンエンド形式の統計タスクにおいて、指導教員との間で高い採点の一貫性を確立し、維持できることが示唆された。
本研究の結果は、大規模授業における採点の負担軽減や、学部生の教育参加促進に繋がる可能性がある。
本研究では、採点者間の議論やフィードバックの影響を考慮していない。今後の研究では、これらの要素が採点の一貫性に与える影響を検討する必要がある。
На другой язык
из исходного контента
arxiv.org
Дополнительные вопросы