核心概念
言語処理の際の単語の予測可能性が、その単語の処理時間に影響を与える。
要約
本研究は、11の異なる言語を対象に、サプライズ理論の3つの予測を検証した。具体的には以下の点を明らかにした:
- サプライズは、すべての言語において読み取り時間を予測する上で有効な指標である。
- 文脈エントロピーも、ほとんどの言語において読み取り時間を予測する上で有効な指標である。文脈エントロピーを加えることで、サプライズだけを使う場合よりも予測精度が向上する。
- サプライズと読み取り時間の関係は、線形であることが示された。より複雑な関数を仮定しても、線形モデルと同等の予測精度しか得られない。
これらの結果は、言語処理における情報理論的指標と心理言語学的プロセスの関係が、言語を超えて安定して成り立つことを示唆している。
統計
サプライズが1ビット増えると、読み取り時間が2-4ミリ秒遅くなる。
単語の頻度が1対数単位増えると、読み取り時間が10ミリ秒ほど短くなる。
単語の長さが1文字増えると、読み取り時間が10-30ミリ秒ほど長くなる。