核心概念
인간 교육과정을 모방한 체계적인 데이터 구축과 학습 방법을 통해 대화형 언어 모델의 성능을 향상시킬 수 있다.
摘要
이 연구는 대화형 언어 모델의 지시 튜닝을 위해 인간 교육과정을 모방한 CORGI 데이터셋과 학습 방법을 제안한다.
- 교육 과정 데이터 구축:
- 중등학교부터 대학원까지의 교육 과정을 통합하여 다양한 주제와 개념을 추출
- 블룸의 taxonomy에 따라 각 개념에 대해 19가지 수준의 인지적 난이도 문제 생성
- 교육과정 기반 지시 튜닝:
- 교육 단계와 인지적 난이도를 고려하여 데이터를 체계적으로 배열 (interleaved curriculum)
- 이를 통해 지식, 추론 능력, 언어 이해 등 다양한 벤치마크에서 성능 향상
- 실험 결과:
- 교육과정 기반 지시 튜닝이 기존 방식 대비 MMLU +2.75, ARC +2.39, PIQA +1.14, OpenBookQA +3.8 향상
- 데이터 필터링과 교육과정 기반 학습이 노이즈 데이터에 강인한 것으로 확인
이 연구는 인간 교육과정을 모방한 체계적인 데이터 구축과 학습 방법이 대화형 언어 모델의 성능 향상에 효과적임을 보여준다.
統計資料
교육 단계별 개념 수: 중등학교 1,800개, 대학교 2,400개, 대학원 1,400개
개념당 19개의 인지적 난이도 문제 생성
필터링 후 최종 데이터셋 크기: 66,000개
引述
"인간 지성의 다양한 분야 간 이동을 가능하게 하는 점진적 지식 심화는 대화형 언어 모델에도 적용될 수 있다."
"교육과정 기반 지시 튜닝은 지식, 추론 능력, 언어 이해 등 다양한 영역에서 성능 향상을 보였다."