이 논문은 마오리어를 모르는 뉴질랜드인(NMS)과 통계적 반복에 기반한 무감독 기계 학습 모델인 Morfessor의 마오리어 단어 분절 성능을 비교한다.
분석 1A에서는 NMS와 Morfessor의 단어 분절 성능을 concatenative 과정(접사화, 복합어 형성)과 템플릿 과정(반복)으로 형성된 단어에 대해 비교한다. 두 학습자 모두 concatenative 과정의 단어에서 성공적이지만, NMS는 템플릿 과정의 단어에서도 더 나은 성과를 보인다. 이는 NMS가 통계적 반복 이외의 요소에 민감하다는 것을 시사한다.
분석 1B에서는 접사 회복률을 통해 NMS와 Morfessor의 차이를 더 자세히 살펴본다. Morfessor는 접사의 기본형과 비기본형 간 차이를 잘 포착하지만, NMS는 접사의 위치와 빈도, 음운론적 템플릿과의 일관성 등에 더 민감한 것으로 나타난다.
분석 2에서는 Morfessor가 concatenative 과정의 단어에서도 NMS보다 성능이 떨어지는 이유를 탐구한다. 실제 마오리어 단어와 통계적 속성은 동일하지만 다른 형태론적 단서를 포함하지 않는 의사 마오리어 단어에 대한 Morfessor의 분절 성능을 비교한 결과, 실제 마오리어 단어에서의 낮은 성능은 통계적 반복 이외의 단서에 NMS가 민감하기 때문인 것으로 나타난다.
이 연구 결과는 인간의 무감독 형태론 학습이 단순한 통계적 학습 이상의 과정을 포함한다는 것을 보여준다. 인간은 단순한 형태 반복 뿐만 아니라 템플릿과 같은 추상적 구조, 그리고 음운론적 특징 등 다양한 단서에 민감하게 반응한다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문