核心概念
大規模言語モデルは人間と同様に代表性ヒューリスティックの影響を受けており、正しい推論を行うことが困難である。
要約
本研究では、大規模言語モデルにおける代表性ヒューリスティックの影響を調査した。代表性ヒューリスティックとは、事象の発生確率を判断する際に、その事象が典型的であるかどうかに基づいて判断してしまう認知バイアスのことである。
研究では、6つのタイプの代表性ヒューリスティックを網羅したREHEATデータセットを作成し、GPT-3.5、GPT-4、PaLM 2、LLaMA 2の4つの大規模言語モデルを評価した。その結果、これらのモデルは人間と同様に代表性ヒューリスティックの影響を受けており、正しい推論を行うことが困難であることが明らかになった。
特に、conjunction fallacyやdisjunction fallacyといったタイプの問題では、モデルの正答率が低かった。これは、文章の中に潜む統計的な関係性を正しく捉えられないためと考えられる。一方で、モデルに対して統計的な知識を活用するよう促すヒントを与えると、パフォーマンスが向上することも示された。
このように、大規模言語モデルは代表性ヒューリスティックの影響を受けやすく、正しい推論を行うことが難しい。今後は、このような認知バイアスを克服するための研究が重要になると考えられる。
統計
大規模言語モデルの代表性ヒューリスティックに関する正答率は10%から50%程度であった。
統計的な知識を活用するよう促すヒントを与えると、モデルのパフォーマンスが向上した。
引用
「大規模言語モデルは人間と同様に代表性ヒューリスティックの影響を受けており、正しい推論を行うことが困難である。」
「特に、conjunction fallacyやdisjunction fallacyといったタイプの問題では、モデルの正答率が低かった。」
「モデルに対して統計的な知識を活用するよう促すヒントを与えると、パフォーマンスが向上した。」