이 연구는 마오리어를 모르는 뉴질랜드인(NMS)의 단어 분절과 Morfessor라는 무감독 기계 학습 모델의 단어 분절을 비교한다. 두 학습자 모두 접사와 복합어 형성과 같은 연접적 과정에서 성공적이지만, NMS는 반복과 변이음 등 템플릿 기반 과정에서도 성공적이다. 이는 NMS의 학습 과정이 단순한 통계적 반복 이상의 것에 민감하다는 것을 시사한다.
분석 1에서는 서로 다른 형태 과정을 거친 단어들에 대한 Morfessor와 NMS의 분절 성능을 비교한다. Morfessor는 연접적 과정의 단어에서 잘 수행하지만, 템플릿 기반 과정의 단어에서는 성능이 떨어진다. 반면 NMS는 템플릿 기반 과정의 단어에서도 잘 수행한다. 이는 NMS가 통계적 반복 이외의 다른 단서에 민감하다는 것을 보여준다.
분석 2에서는 Morfessor가 실제 마오리어 단어보다 통계적 속성이 동일한 가상 마오리어 단어에서 더 잘 수행한다는 것을 보여준다. 이는 실제 마오리어 단어에 통계적 반복 이외의 다른 단서가 존재한다는 것을 시사한다.
결과적으로 이 연구는 인간의 형태 분절 학습이 단순한 통계적 학습 이상의 것을 포함한다는 것을 보여준다. 인간은 템플릿과 같은 추상적 구조와 음운론적 특징과 같은 다른 단서에도 민감하다.
Egy másik nyelvre
a forrásanyagból
arxiv.org
Mélyebb kérdések