Core Concepts
단어 순서 변화에는 엔트로피 최소화와 스왑 거리 최소화라는 두 가지 원리가 작용한다.
Abstract
이 논문은 단어 순서 변화에 작용하는 두 가지 원리, 즉 엔트로피 최소화와 스왑 거리 최소화를 조사한다.
엔트로피 최소화는 자연 언어 시스템의 구조를 형성하는 것으로 알려져 있다. 이는 단일 단어 수준에서뿐만 아니라 구문 구조 수준에서도 적용된다. 엔트로피 최소화는 단 하나의 단어 순서만 사용하는 것이 최적이라고 예측한다.
스왑 거리 최소화는 인접한 요소들 간의 스왑 횟수가 최소화되는 단어 순서를 선호한다는 원리이다. 이는 단어 순서 처리의 인지적 용이성과 관련이 있다.
이 논문에서는 이 두 원리가 다양한 구문 구조에서 어떻게 작용하는지 조사한다. 특히 평균 스왑 거리라는 새로운 지표를 도입하여 스왑 거리 최소화 효과를 분석한다.
실험 결과, 엔트로피 최소화와 스왑 거리 최소화 효과가 모두 관찰되었다. 특히 스왑 거리 최소화 효과는 단어 순서 빈도 분포를 유지하더라도 여전히 나타났다. 이는 스왑 거리 최소화가 엔트로피 최소화를 넘어선 제약을 포착한다는 것을 보여준다.
Stats
단어 순서 빈도 데이터는 다음과 같다:
SOV 구조: 언어 수준 빈도 (WALS)
VOX 구조: 언어 수준 빈도 (WALS)
nAND 구조: 언어, 속, 조정 언어 수준 빈도 (Hammarström)
SOV, OVI, SOVI 구조: 힌디-우르두 구어체 말뭉치 빈도 (Leela et al.)
SOV 구조: 힌디-우르두 아동 대상 발화 말뭉치 빈도 (Leela et al.)
SOV 구조: 말라얄람 말뭉치 빈도 (Leela et al.)
SOV 구조: 실험 데이터 빈도 (Lev-Ari)
Quotes
"단어 순서 변화에는 엔트로피 최소화와 스왑 거리 최소화라는 두 가지 원리가 작용한다."
"스왑 거리 최소화 효과는 단어 순서 빈도 분포를 유지하더라도 여전히 나타났다. 이는 스왑 거리 최소화가 엔트로피 최소화를 넘어선 제약을 포착한다는 것을 보여준다."