核心概念
本稿では、項目反応理論(IRT)などの心理測定法を用いることで、AI支援による物理試験の評価において、人間の介入が必要となる状況を特定し、採点の信頼性を確保できる可能性を示唆しています。
Kortemeyer, G., & Nöhl, J. (2024). Assessing Confidence in AI-Assisted Grading of Physics Exams through Psychometrics: An Exploratory Study. arXiv preprint arXiv:2410.19409v1.
本研究は、AI支援による物理試験の採点において、心理測定法、特に項目反応理論(IRT)を用いることで、AI採点の信頼性を評価することを目的としています。具体的には、採点ルーブリックの反復的な改善方法と、AIによる採点が信頼できる場合と人間の介入が必要となる場合を決定するための閾値パラメータの役割について検討しています。