Core Concepts
大規模言語モデルの自信表現能力を向上させるため、過去の経験から学習する手法を提案する。
Abstract
本論文は、大規模言語モデル(LLM)の自信表現能力を向上させる手法を提案している。LLMは様々なタスクで優れた性能を示すものの、生成した回答に対する自信の表現が適切ではない場合がある。そこで本研究では、認知診断の手法に着想を得て、「過去の経験からの学習(LePe)」と呼ばれる手法を提案している。
LePeは主に3つのステージから構成される:
テストステージ: LLMの本来の自信レベルを把握するため、複数回にわたって質問に回答させ、その正解率と自信レベルを記録する。
学習ステージ: 記録したデータを用いて、LLMに自信表現能力を学習させる。正解率と自信レベルの関係を学習することで、適切な自信表現ができるようになる。
予測ステージ: 新しい質問に対してLLMが自信を適切に表現できるかを検証する。
また、LLMの回答の一貫性を高めるため、質問の変形や回答のサンプリング手法を工夫している。
実験の結果、提案手法LePeを用いることで、LLMの自信表現能力が大幅に向上し、回答の正解率と自信レベルの相関が高くなることが示された。さらに、LePeは他のデータセットにも適用可能であり、汎化性も高いことが確認された。
Stats
正解率が65%を超える回答の正解率は73.62%に達する。
正解率が55%を超える回答の正解率は46.3%に達する。
自信レベルが65%を超える回答の割合は26.33%である。
自信レベルが55%を超える回答の割合は24.30%である。
Quotes
"大規模言語モデル(LLM)は様々なタスクで優れた性能を示すものの、生成した回答に対する自信の表現が適切ではない場合がある。"
"本研究では、認知診断の手法に着想を得て、「過去の経験からの学習(LePe)」と呼ばれる手法を提案している。"
"LePeを用いることで、LLMの自信表現能力が大幅に向上し、回答の正解率と自信レベルの相関が高くなることが示された。"