核心概念
大規模言語モデルのテキスト回答は、選択肢の確率に基づく回答よりも、様々な問題の変化に対してより堅牢である。
要約
本論文は、大規模言語モデルの4択問題への回答方式の堅牢性を調査したものである。従来の研究では、選択肢の確率に基づいて回答を評価する手法が主流であったが、近年の命令調整型の言語モデルでは、テキスト回答とその確率が一致しないことが指摘されている。
そこで本研究では、テキスト回答の堅牢性を検証した。その結果、以下のことが明らかになった:
- テキスト回答は、選択肢の順序変更などの変化に対して、選択肢の確率に基づく回答よりも堅牢である。
- 選択肢の確率と回答テキストのミスマッチ率が高い場合ほど、両者の堅牢性の差が大きくなる。
- ミスマッチ率が50%を超える場合、テキスト回答は、最先端の確率デバイアス除去手法よりも選択肢順序変更に対して堅牢である。
以上の結果から、テキスト回答に基づく評価の有効性が示された。
統計
選択肢の確率に基づく回答は、問題文の変化に対して脆弱である。
テキスト回答は、選択肢の順序変更に対して、確率に基づく回答よりも堅牢である。
ミスマッチ率が高い場合、テキスト回答の方が確率に基づく回答よりも堅牢である。
引用
"The text answers are more robust to question perturbations than the first token probabilities, when the first token answers mismatch the text answers."
"When the mismatch reaches over 50%, the text answer is more robust to option order changes than the debiased first token probabilities using state-of-the-art debiasing methods such as PriDe."