Core Concepts
順列自己一貫性は、大規模言語モデルの順位付けにおける位置バイアスを軽減し、順位付けの質、一貫性、プロンプトの順序に対する不変性を向上させる。
Abstract
本論文は、大規模言語モデル(LLM)の順位付けにおける位置バイアスの問題に取り組む。LLMは文脈の使い方に位置バイアスを示し、特に順位付けタスクに影響を及ぼす。
提案手法の順列自己一貫性は以下の2段階で構成される:
プロンプトの入力リストをランダムに並び替えて複数回LLMに通し、異なる位置バイアスを持つ出力ランキングを生成する。
生成された出力ランキングの中央ランキングを計算する。これにより、個別の位置バイアスを marginalize することができる。
理論的には、提案手法は一定の条件の下で真のランキングを一致的に推定することを示した。
実験的には、数学式の並べ替え、単語の並べ替え、文章の並べ替えの3つの合成タスクと、TREC Deep Learning Trackのパッセージ再ランキングタスクで評価した。提案手法は、GPT-3.5、GPT-4、LLaMA v2などの大規模言語モデルの順位付け精度を34-52%、7-18%、8-16%向上させた。
また、位置バイアスの分析を行い、モデルによって異なる位置バイアスパターンが存在することを示した。
Stats
提案手法は、GPT-3.5、GPT-4、LLaMA v2の順位付け精度を34-52%、7-18%、8-16%向上させた。
提案手法は、Mistralモデルとzephyrモデルの順位付け精度をそれぞれ42%と106%向上させた。
Quotes
"LLMは位置バイアスを示し、特に順位付けタスクに影響を及ぼす。"
"提案手法の順列自己一貫性は、LLMの順位付けの質、一貫性、プロンプトの順序に対する不変性を向上させる。"
"提案手法は、一定の条件の下で真のランキングを一致的に推定することを理論的に示した。"