Core Concepts
LLM을 활용하여 중학교 지구과학 교육과정의 형성 평가 응답을 자동으로 채점하고 의미 있는 설명을 제공하는 방법을 제시한다.
Abstract
이 연구는 LLM(Large Language Model)을 활용하여 중학교 지구과학 교육과정의 형성 평가 응답을 자동으로 채점하고 설명을 제공하는 방법을 제안한다.
먼저, 증거 중심 설계(ECD)를 통해 평가 문항을 학습 목표와 연계하였다. 3개의 형성 평가 문항을 선정하였는데, 이 문항들은 학생들이 물 유출 관련 개념 이해와 과학적 추론 능력을 평가한다.
연구진은 GPT-4를 활용하여 학생 응답을 자동으로 채점하고 설명을 생성하는 접근법을 개발하였다. 이를 위해 다음과 같은 단계를 거쳤다:
사전 라벨링된 예시 문항과 Chain-of-Thought 추론을 포함하는 프롬프트를 개발하였다.
인간 평가자와의 신뢰도 분석을 통해 모델의 오류 패턴을 파악하고, 이를 프롬프트에 반영하는 능동적 학습(Active Learning) 과정을 수행하였다.
최종 프롬프트를 활용하여 새로운 학생 응답을 자동으로 채점하고 설명을 생성하였다.
연구 결과, 제안한 방법은 대부분의 문항에서 인간 평가자와 높은 수준의 일치도를 보였다. 또한 모델이 생성한 설명은 학생과 교사에게 유용한 피드백을 제공할 수 있을 것으로 기대된다. 다만 일부 문항에서 모델의 과적합 경향이 관찰되어, 이를 개선하기 위한 추가 연구가 필요할 것으로 보인다.
Stats
"학생들은 모델의 화살표 크기가 물의 양을 나타낸다는 것을 이해했다."
"모델의 강수 화살표 크기가 유출 화살표 크기보다 작아야 한다는 물질 보존 원리를 학생들이 설명했다."
"학생들은 모델의 유출 화살표 방향이 잘못되었다고 지적했다."
Quotes
"LLM을 활용하여 과학 교육 분야의 개방형 단답형 평가를 자동으로 채점하고 피드백을 생성할 수 있는 효과적인 메커니즘을 제공한다."
"교사와 연구자가 평가 루브릭을 개선하는 데 모델의 결과와 설명을 활용할 수 있다."
"Chain-of-Thought 추론과 능동적 학습을 통해 모델의 오류를 식별하고 개선할 수 있다."