toplogo
Logg Inn
innsikt - 教育 - # 採点者間信頼性

学部生の採点者間における、オープンエンド形式の統計タスクの採点の一貫性に関する研究


Grunnleggende konsepter
適切なトレーニングと質の高い評価基準を用いることで、学部生の採点者でも、オープンエンド形式の統計タスクにおいて、指導教員との間で高い採点の一貫性を確立し、維持できることが実証された。
Sammendrag

研究論文の概要

書誌情報

Beckman, M.D., Burke, S., Fiochetta, J., Fry, B., Lloyd, S.E., Patterson, L., & Tang, E. (出版年不詳). Developing Consistency Among Undergraduate Graders Scoring Open-Ended Statistics Tasks.

研究目的

本研究は、オープンエンド形式の統計タスクを採点する学部生の採点者チームが、トレーニングと経験を積むにつれて、採点の一貫性がどのように変化するかを調査することを目的とした。

方法

経験豊富な統計学教員1名と、統計学またはデータサイエンスを専攻する学部生4名を対象に、計5回の採点演習を実施した。最初の演習では、解答例と口頭での指示のみによる「最小限の評価基準」を用いて採点を行った。2回目と3回目の演習では、採点者自身が作成した評価基準と、他の採点者が作成した評価基準を用いて採点を行った。4回目と5回目の演習では、研究者が作成した詳細な「専門家評価基準」を用いて採点を行った。5回目の演習は、4回目の演習から約10週間後に行った。採点の一貫性は、2つの評価基準間の一致度を測る指標であるQuadratic Weighted Kappa (QWK)を用いて評価した。

主な結果

学部生の採点者と指導教員との間の採点の一貫性は、トレーニングと経験を積むにつれて向上した。「専門家評価基準」を用いた場合、学部生の採点者と指導教員との間のQWK値は、最初の演習では0.50~0.70程度であったが、最後の演習では0.70~0.80程度に向上した。また、学部生の採点者同士の採点の一貫性も、トレーニングと経験を積むにつれて向上した。

結論

適切なトレーニングと質の高い評価基準を用いることで、学部生の採点者でも、オープンエンド形式の統計タスクにおいて、指導教員との間で高い採点の一貫性を確立し、維持できることが示唆された。

意義

本研究の結果は、大規模授業における採点の負担軽減や、学部生の教育参加促進に繋がる可能性がある。

制限と今後の研究

本研究では、採点者間の議論やフィードバックの影響を考慮していない。今後の研究では、これらの要素が採点の一貫性に与える影響を検討する必要がある。

edit_icon

Tilpass sammendrag

edit_icon

Omskriv med AI

edit_icon

Generer sitater

translate_icon

Oversett kilde

visual_icon

Generer tankekart

visit_icon

Besøk kilde

Statistikk
指導教員(評価者A)と学部生の評価者E、F、Gとのペアワイズ一致度は、1日目から5日目にかけて向上し、Quadratic Weighted Kappa (QWK)値はそれぞれ0.57から0.64、0.51から0.78、0.61から0.73に向上した。 評価者Hと評価者Aの一致度は、1日目から10週間後まで大きな変化はなく、QWK値は約0.75で推移した。 グループ全体の一致度は、GwetのAC2を用いて測定した結果、1日目の0.688から5日目の0.776、10週間後の0.781へと向上した。
Sitater
"This study demonstrates compelling evidence that undergraduate students can rapidly develop the ability to establish and sustain substantial agreement with an instructor." "Several undergraduate RAs made statistically noticeable gains in their agreement with the instructor (Rater A) when using a quality rubric at the end of their first week, which appeared to persist for the duration of the 10 week program."

Dypere Spørsmål

オンライン学習環境において、学部生の採点者を効果的にトレーニングするには、どのような方法が考えられるか?

オンライン学習環境において学部生の採点者を効果的にトレーニングするには、対面式トレーニングと同様の要素を盛り込みつつ、オンラインならではの特性を活かすことが重要です。具体的には、以下のような方法が考えられます。 非同期学習教材の活用: 採点基準、評価対象となるタスクの解説、採点例などをまとめた動画教材やテキスト教材を作成し、採点者が自分のペースで学習できるようにする。 採点演習とフィードバック: 実際の採点に近い形式で演習を行い、教員や経験豊富な採点者からフィードバックを受ける機会を設ける。オンラインの採点システムやピアレビューシステムを活用することで、効率的にフィードバックを提供することが可能となる。 オンラインでの質疑応答: 採点に関する疑問点を解消するためのフォーラムやチャットツールを導入し、採点者同士や教員とのコミュニケーションを促進する。定期的なオンラインミーティングや個別面談なども有効である。 採点基準の一貫性を保つための工夫: 採点基準を明確化し、具体的な採点例を豊富に示すことで、採点者間の一貫性を高める。また、採点中に参照できるFAQページや用語集を作成することで、疑問が生じた際にすぐに解決できる環境を整える。 採点者同士の交流促進: オンラインでのグループワークやディスカッションを通して、採点者同士が互いの考え方を共有し、採点基準の理解を深める機会を設ける。 オンライン学習環境では、対面式に比べてコミュニケーション不足やモチベーション維持が課題となる場合があるため、これらの課題を克服するための工夫も重要となります。

採点基準の質が採点の一貫性に与える影響は、評価対象となるタスクの難易度によって異なるのだろうか?

採点基準の質が採点の一貫性に与える影響は、評価対象となるタスクの難易度によって異なる可能性があります。 難易度の高いタスク: 複雑な思考力や応用力が求められる難易度の高いタスクの場合、採点基準が曖昧であったり、具体的な採点例が不足していたりすると、採点者によって解釈が分かれ、採点の一貫性が損なわれる可能性が高くなります。採点基準を詳細化し、多様な解答例を網羅することで、採点者間で解釈のずれが生じるリスクを低減できます。 難易度の低いタスク: 一方で、単純な知識や技能を問う難易度の低いタスクの場合、採点基準が多少曖昧であっても、採点者間で大きな解釈の違いが生じる可能性は低いため、採点基準の質が採点の一貫性に与える影響は比較的小さいと考えられます。しかし、採点基準が明確であることで、採点の効率性や客観性を高めることができます。 いずれの場合においても、質の高い採点基準は、採点の一貫性、効率性、客観性を向上させるために重要です。特に、難易度の高いタスクを評価する際には、採点基準の質が採点結果の信頼性に大きく影響するため、より一層の注意が必要です。

AI技術を用いて採点の自動化を進めることで、教育現場における評価はどのように変化していくと考えられるか?

AI技術を用いて採点の自動化を進めることで、教育現場における評価は大きく変化していくと考えられます。 採点の効率化と客観性向上: AIは、大量の答案を高速かつ正確に採点することができるため、教員の負担を大幅に軽減し、他の教育活動に時間を割くことができるようになります。また、AIは感情や主観に左右されずに採点を行うため、より客観的な評価が可能となります。 多様な評価手法の実現: AIは、従来の選択式問題や記述式問題だけでなく、プレゼンテーションやグループワーク、ポートフォリオなど、多様な学習活動に対する評価にも活用できます。これにより、生徒一人ひとりの学習状況や能力をより多角的に把握することが可能となります。 個別最適化された学習指導: AIによる採点結果や学習データの分析を通して、生徒一人ひとりの得意・不得意や学習進捗を把握し、個別に最適化された学習指導やフィードバックを提供することが可能となります。 人間による評価の重要性: しかし、AIによる採点の自動化が進む一方で、人間による評価の重要性は依然として高いと言えます。特に、複雑な思考力や表現力、創造性などを評価する際には、人間の経験や洞察力が必要不可欠です。 AI技術は、あくまでも教育を支援するためのツールの一つです。AI技術のメリットを最大限に活かしつつ、人間によるきめ細やかな指導と組み合わせることで、より質の高い教育の実現を目指していく必要があります。
0
star