이 연구는 아동-보호자 대화에서 문법성을 자동으로 주석화하는 도구를 개발하였다. 먼저 문법성 주석 체계를 제안하고, 4,000개 이상의 발화를 수동으로 주석하였다. 이를 바탕으로 다양한 기계학습 모델을 학습하고 평가하였다. 그 결과 미세 조정된 Transformer 모델이 가장 우수한 성능을 보였으며, 인간 간 주석 일치도 수준에 근접하였다. 이렇게 개발된 도구를 활용하여 영어 CHILDES 데이터베이스의 2-5세 아동 발화 27만 6천 개를 자동으로 주석하였다. 그 결과 아동의 연령이 증가함에 따라 문법적 발화 비율이 지속적으로 증가하는 것을 확인하였다. 이 연구는 아동 언어 습득 연구를 대규모로 수행할 수 있는 기반을 마련하였다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문