核心概念
言語モデルは質問に答えるために、事前学習中に獲得した知識と提示された文脈を統合する必要がある。モデルはこの統合を予測可能な方法で行い、より馴染みのある実体に関する質問では事前知識に、文脈に影響されやすい質問では文脈に依存する傾向がある。
要約
本論文では、言語モデルの振る舞いを分析するための2つの指標を提案する。
説得力スコア:ある文脈がモデルの答え分布にどの程度影響を与えるかを表す指標
感受性スコア:ある実体に関する質問に対してモデルの答え分布がどの程度文脈に左右されるかを表す指標
これらの指標は相互情報量に基づいており、モデルの振る舞いを忠実かつ包括的に反映する。
実験では、これらの指標を用いて以下の知見を得た:
関連性の高い文脈は関連性の低い文脈よりも説得力が高い
断言的な文脈は基本的な文脈よりも説得力が高い(閉じた質問の場合)
頻繁に登場する実体は感受性が低く、知識グラフ上の次数が高い実体も感受性が低い
さらに、これらの指標を友敵関係の分析やジェンダーバイアスの分析に適用し、有用性を示した。
統計
頻繁に登場する実体ほど、モデルの答え分布が文脈に左右されにくい。
知識グラフ上の次数が高い実体ほど、モデルの答え分布が文脈に左右されにくい。
引用
「言語モデルは質問に答えるために、事前学習中に獲得した知識と提示された文脈を統合する必要がある。」
「モデルはこの統合を予測可能な方法で行い、より馴染みのある実体に関する質問では事前知識に、文脈に影響されやすい質問では文脈に依存する傾向がある。」