Khái niệm cốt lõi
単語順序変動は、情報量最小化と、隣接要素のスワップ数を最小化する原理によって制約されている。
Tóm tắt
本論文では、単語順序変動の問題を統計力学の観点から検討している。具体的には、n個の要素からなる言語構造の可能な順序n!個について、2つの原理によって制約されていることを示す。
1つ目の原理は情報量最小化であり、自然言語コミュニケーションシステムの様々なレベルで形成的な役割を果たすと提案されている。情報量最小化は、単一の順序のみを使用することが最適であることを予測する。
2つ目の原理はスワップ距離最小化であり、隣接要素のスワップ数が少ない順序が好まれるというものである。本論文では、任意のnに対するスワップ距離の平均値を表す新しい指標を導入し、その理論的分布の特性を明らかにする。
さらに、n=3やn=4の様々な言語構造について、情報量最小化とスワップ距離最小化の両方の原理が有意に当てはまることを示す。特に、単語順序の頻度をシャッフルしても、なおスワップ距離最小化の効果が見られることから、スワップ距離最小化は情報量最小化を超えた制約であることが明らかになった。
Thống kê
単語順序の頻度は、言語数や言語族数などで測定されている。
SOV構造の優勢順序の頻度は言語数で53%である。
VOX構造の優勢順序の頻度は言語数で42%である。
nAND構造の優勢順序の頻度は言語数で調整後で25%である。
Trích dẫn
"単語順序変動は、情報量最小化と、隣接要素のスワップ数を最小化する原理によって制約されている。"
"情報量最小化は、単一の順序のみを使用することが最適であることを予測する。"
"スワップ距離最小化は、隣接要素のスワップ数が少ない順序が好まれるというものである。"