核心概念
Contrastive Decoding (CD)は、巨大言語モデルの確率を線形外挿していると解釈できるが、その過程で「明白な盲点」が生じ、性能が制限される。本研究では、この問題に対処するため、漸近的確率デコーディング (APD) を提案し、より正確な確率外挿を通じて、特に事実性に優れたテキスト生成を実現する。
要約
Contrastive Decoding (CD) の理論的解釈と限界、そして漸近的確率デコーディング (APD) の提案
本論文は、巨大言語モデル (LLM) のデコーディング手法である Contrastive Decoding (CD) の理論的解釈と、その限界を克服する新たな手法である Asymptotic Probability Decoding (APD) を提案しています。
CDは、小規模な言語モデル (アマチュアLM) を用いて、大規模な言語モデル (エキスパートLM) の次単語予測分布を改善する手法です。
CDの理論的裏付け: CDは、巨大で仮説的なLMのロジットを線形外挿していると解釈できることを理論的に証明しました。
CDの限界: 線形外挿により、アマチュアLMが既に高い確率を割り当てている明白な答えをCDが見落とす可能性があることを示しました (「明白な盲点」)。
APDの提案: CDの限界を克服するため、漸近的確率デコーディング (APD) を提案しました。APDは、異なるサイズのLMからの確率曲線を明示的に外挿することで、無限に大きなLMからの漸近確率を推定します。