本研究では、言語モデルに不確実性を表す言語表現を生成させる手法を提案している。
まず、言語モデルの自己評価タスクを用いて、モデルの予測に対する自信度を測定する。この自信度スコアを、人間が不確実性表現と関連付けた確率範囲にマッピングすることで、言語表現を生成する。
次に、この不確実性表現を付加した予測データセットを用いて、言語モデルをファインチューニングする。実験の結果、ファインチューニング後のモデルは、様々なデータセットにおいて、よく較正された不確実性表現を生成することが示された。特に、予測の後に不確実性表現を付加する方法が最も良好な較正結果を示した。
この手法により、ユーザーは言語モデルの出力に含まれる不確実性を把握し、適切に活用することができるようになる。これは、医療や法律など、安全性が重要な分野での言語モデルの活用を促進すると考えられる。
Vers une autre langue
à partir du contenu source
arxiv.org
Questions plus approfondies