本研究では、再帰的数値システムの起源と発展を説明するメカニズムを探る。情報理論的な効率性の圧力の下で、強化学習を用いて数値システムの語彙を最適化する方法を提案している。
まず、Hurfordのメタ文法を改良し、語彙サイズと平均形態統語的複雑性のトレードオフを最適化するPareto最適解を推定する。次に、強化学習を用いて直接語彙を最適化する手法を示す。この手法により、人間の数値システムに類似した効率的な構造を持つ言語が得られることを示す。
強化学習ベースのアプローチは、単一の合理的な主体が数値システムを漸進的に最適化していく過程を捉えている。この単純なモデルは、言語進化のダイナミクスを探求する際の出発点となる。今後は、コミュニケーションの圧力などの他の要因を組み込むことで、より現実的なメカニズムを明らかにできると期待される。
На другой язык
из исходного контента
arxiv.org
Дополнительные вопросы