Core Concepts
大規模言語モデルのキャリブレーションを改善するためのTHERMOMETERアプローチの効果的な提案。
Abstract
大規模言語モデル(LLM)におけるキャリブレーションの重要性と挑戦に焦点を当てる。
THERMOMETERは、LLM向けの特別なキャリブレーションアプローチであり、多くのタスクで優れた結果を示す。
複数タスクから学習し、新しいタスクでも適応可能なパラメータ化マッピングを使用してLLMをキャリブレートする。
Introduction
LLMが確率分布を定義し、多様なタスクで優れたパフォーマンスを発揮することが示されている。
しかし、事前学習済みLLMsはしばしば適合手法によって不十分にキャリブレートされることが指摘されている。
Calibration Challenges in LLMs
LLMsは他の確率予測者と同様に、正確性だけでなく適切なキャリブレーションも重要。
既存の手法では、LLMsへの適切なキャリブレーションが困難であることが示唆されている。
THERMOMETER Approach
THERMOMETERは複数タスクから学習し、新しいタスクでも適応可能なパラメータ化マッピングを使用してLLMsをキャリブレートする方法。
実験結果は、提案手法が競合手法よりも優れた結果を示すことを明らかにしている。
Stats
最近の研究では、事前学習済みLLMsがしばしば不十分にキャリブレートされていることが指摘されています。
THERMOMETERは複数タスクから学習し、新しいタスクでも適応可能なパラメータ化マッピングを使用してLLMsをキャリブレートします。
Quotes
"Calibration is a desirable property of any probabilistic forecaster."
"Recent studies suggest that while pre-trained LLMs are often well-calibrated, alignment interventions harm calibration."