Основные понятия
본 연구는 GPT-4를 활용하여 중학교 지구과학 교과의 형성 평가 응답을 자동으로 채점하고 의미 있는 설명을 제공하는 접근법을 제안한다. 인간-기계 협업 방식을 통해 학생들의 개념 이해와 추론 능력을 효과적으로 평가하고 지원할 수 있다.
Аннотация
본 연구는 중학교 지구과학 교과의 물 유출 관련 형성 평가 문항을 대상으로 한다. 3개의 문항에서 학생들은 제시된 개념 모델의 장단점을 분석하고 설명해야 한다. 연구진은 GPT-4를 활용하여 이러한 개방형 단답형 평가 문항을 자동으로 채점하고 피드백을 생성하는 접근법을 제안한다.
접근법의 핵심 단계는 다음과 같다:
- 인간 평가자 간 신뢰도 확보를 위한 IRR(Inter-Rater Reliability) 과정 수행
- 소수 예시 데이터와 사고 과정 설명을 포함한 프롬프트 개발
- 능동 학습(Active Learning)을 통해 모델의 오류 패턴 식별 및 프롬프트 개선
- 개선된 프롬프트를 활용하여 새로운 학생 응답 자동 채점 및 피드백 생성
연구 결과, 제안 접근법은 대부분의 문항에서 인간 평가자와 유사한 수준의 채점 성능을 보였다. 특히 개념 이해 관련 문항에서 우수한 성과를 달성했다. 다만 추론 능력 관련 문항에서는 모델의 성능이 다소 저하되었는데, 이는 문항 및 채점 기준의 모호성에 기인한 것으로 분석된다. 향후 연구에서는 이러한 한계를 보완하고 교사의 피드백을 반영하여 모델 성능을 지속적으로 개선할 계획이다.
Статистика
"학생의 응답에서 X라고 말했습니다. 채점 기준에 따르면 Y입니다. 따라서 학생의 점수는 Z점입니다."
Цитаты
"모델의 추론 오류로 인해 여러 인스턴스의 잘못된 채점이 발생했습니다."
"교사와 모델 간 점수 차이를 분석하여 채점 기준 및 평가 문항 개선의 기회를 찾을 수 있습니다."
"모델이 긍정적인 예측에 대한 설명을 제공하지 않는 경우가 있어 이에 대한 개선이 필요합니다."