핵심 개념
클릭스트림 데이터를 활용하여 학생들의 수학 과제 수행 점수를 정확하게 예측할 수 있는 트리 기반 모델 ClickTree를 개발하였다.
초록
이 연구에서는 ClickTree라는 트리 기반 모델을 개발하여 학생들의 수학 과제 수행 점수를 예측하였다. 연구팀은 학생들의 클릭스트림 데이터에서 다양한 특징을 추출하였고, CatBoost 트리 모델을 사용하여 학생들이 과제 문제를 정답으로 풀었는지 여부를 예측하였다.
ClickTree 모델은 EDMcup 2023 경진대회에서 2위를 차지하며 약 79%의 정확도를 달성하였다. 연구 결과 분석을 통해 다음과 같은 주요 발견사항을 확인하였다:
- 정답 선택형, 대수 II, 히스토그램 등의 문제 유형과 주제가 학생들에게 더 어려운 것으로 나타났다.
- 과제를 많이 완료하고 정답을 많이 맞힌 학생들이 최종 과제에서 더 높은 점수를 받았다. 반면 힌트나 답변을 자주 요청한 학생들은 최종 과제에서 어려움을 겪었다.
- ClickTree 모델은 학생들의 클릭스트림 데이터를 활용하여 수학 과제 수행 점수를 정확하게 예측할 수 있었다. 특히 문제 유형, 문제 수행 성과, 과제 완료 횟수 등의 특징이 중요한 역할을 하였다.
이러한 결과를 바탕으로 교육자들은 학생들의 학습 경험을 개선하고 효과적인 교육 전략을 수립할 수 있을 것이다. 특히 어려운 문제 유형과 주제에 대한 추가 지원을 제공하고, 학습 과정에서 어려움을 겪는 학생들을 조기에 파악하여 맞춤형 지원을 할 수 있을 것이다.
통계
학생들이 과제 문제를 정답으로 풀었을 때의 평균 점수는 0.78이었다.
학생들이 과제 문제를 틀렸을 때의 평균 점수는 0.22이었다.
학생들이 과제 문제를 풀 때 평균적으로 112.48번 문제를 완료하였다.
학생들이 과제 문제를 풀 때 평균적으로 2.24번 힌트를 요청하였다.
인용구
"학생들이 과제 문제를 많이 완료하고 정답을 많이 맞힌 경우 최종 과제에서 더 높은 점수를 받았다."
"학생들이 힌트나 답변을 자주 요청한 경우 최종 과제에서 어려움을 겪었다."