核心概念
少量の未ラベルサンプルを使って、言語モデルの信頼度推定を特定のドメインに合わせて再較正する新しい手法を提案する。
要約
本論文では、言語モデル(LM)の信頼度推定が全体的には良好であっても、特定のドメインでは大きな誤差が生じる問題に取り組む。
LMは全体的な分布では良好に較正されているように見えるが、個別のドメインでは大きな過信や過小評価が見られる。
提案手法は、少量の未ラベルサンプルを使って、特定のドメインに合わせて信頼度推定を再較正する。
具体的には、入力された少量サンプルから、そのドメインに適した精度曲線を予測する再較正モデルを学習する。
この再較正モデルを使うことで、特定のドメインでの信頼度推定を改善し、目標精度を達成するための閾値を見つけたり、較正誤差を低減したりできる。
実験では、提案手法が既存手法に比べて一貫して良好な性能を示すことを確認した。
統計
全体的な分布では較正誤差(ECE)が0.02と良好だが、個別ドメインでは最大250%高い誤差が見られる。
提案手法は、PaLM2-Largeのドメイン別ECEを16%改善できる。
引用
"LMは全体的な分布では良好に較正されているように見えるが、個別のドメインでは大きな過信や過小評価が見られる。"
"提案手法は、少量の未ラベルサンプルを使って、特定のドメインに合わせて信頼度推定を再較正する。"