Основні поняття
透過適當的訓練和高品質的評分標準,大學生評分員可以培養出與教師評分開放式統計任務時,達成並維持高度一致性的能力。
Анотація
書目資訊
Beckman, M. D., Burke, S., Fiochetta, J., Fry, B., Lloyd, S. E., Patterson, L., & Tang, E. (未出版). 大學生評分員評分開放式統計任務一致性之培養。
研究目標
本研究旨在探討大學生評分員在接受培訓和獲得評分開放式統計任務經驗後,評分一致性的發展趨勢。
研究方法
研究對象
- 一名經驗豐富的統計學教師(評分員 A)。
- 四名大學生研究助理(評分員 E、F、G 和 H),他們曾擔任大型統計學入門課程的助教,但沒有正式接受過評分開放式統計任務的培訓。
研究設計
- 五個階段的評分練習,包括使用簡化評分標準、個人評分標準、同伴評分標準和專家評分標準。
- 評分練習的資料集來自先前研究中收集的近 2000 名學生的開放式統計任務回答。
- 使用二次加權 Kappa (QWK) 和 Gwet's AC2 評估評分員間和評分員內的一致性。
主要發現
- 大學生評分員在接受培訓並使用高品質評分標準後,能夠快速培養出與教師評分開放式統計任務時,達成並維持高度一致性的能力。
- 在使用簡化評分標準時,評分員間的一致性較低,但在接受培訓並使用專家評分標準後,一致性顯著提高。
- 評分員的自我一致性與其與教師評分的一致性相似。
- 評分員團隊在接受培訓和進行幾次評分練習後,整體一致性顯著提高。
主要結論
- 大學生評分員可以成為評分開放式統計任務的可靠資源,特別是在接受適當培訓和使用高品質評分標準的情況下。
- 培訓和高品質評分標準對於確保評分一致性至關重要。
研究意義
本研究結果對大學教學具有重要意義,特別是在大型統計學課程中,教師經常依賴助教或評分員協助評分。
研究限制與未來研究方向
- 本研究的樣本量相對較小,未來研究可以使用更大的樣本量來驗證研究結果。
- 未來研究可以探討不同培訓方法和評分標準對評分一致性的影響。
Статистика
研究團隊由一名經驗豐富的統計學教師和四名大學生研究助理組成。
評分練習的資料集來自先前研究中收集的近 2000 名學生的開放式統計任務回答。
評分員間一致性的二次加權 Kappa (QWK) 值介於 0.79 到 0.83 之間,表示一致性很高。
使用專家評分標準時,大學生評分員與教師評分的一致性顯著提高。
評分員團隊在接受培訓和進行幾次評分練習後,整體一致性(Gwet's AC2)顯著提高。
Цитати
“大學生評分員可以培養出與教師評分開放式統計任務時,達成並維持高度一致性的能力。”
“培訓和高品質評分標準對於確保評分一致性至關重要。”