이 연구는 아동-보호자 대화에서 문법성을 자동으로 주석화하는 도구를 개발하였다. 먼저 문법성 주석 체계를 제안하고, 4,000개 이상의 발화를 수동으로 주석하였다. 이를 바탕으로 다양한 NLP 모델을 학습하고 평가하였다. 그 결과 미세 조정된 Transformer 기반 모델이 가장 우수한 성능을 보였으며, 이는 사람 간 주석 일치도 수준에 근접하였다.
이렇게 개발된 도구를 활용하여 영어 CHILDES 데이터에서 2-5세 아동의 발화 276,200개를 자동으로 주석하였다. 분석 결과, 아동의 연령이 증가함에 따라 문법적 발화 비율이 증가하고 비문법적/모호한 발화 비율이 감소하는 것을 확인하였다.
이 연구는 아동 언어 습득 연구에 자동화된 문법성 주석 도구를 제공함으로써, 대규모 데이터 분석을 가능하게 하고 기존 연구 결과에 대한 재현성과 일반화를 높일 수 있다. 또한 이를 통해 문법 습득 과정에 대한 이해를 높이고, 언어 장애 아동 진단 등 다양한 응용 분야에 활용될 수 있다.
toiselle kielelle
lähdeaineistosta
arxiv.org
Tärkeimmät oivallukset
by Mitja Nikola... klo arxiv.org 03-22-2024
https://arxiv.org/pdf/2403.14208.pdfSyvällisempiä Kysymyksiä