本研究は、大規模言語モデル(LLM)の出力の不確実性を推定し定量化する問題に取り組んでいる。LLMは多くのタスクで高い能力を示すが、時に信頼できない出力を生成することがある。そのため、LLMの出力の不確実性を推定し定量化することが重要となる。
本研究では、まず不確実性推定の問題を定式化し、LLMの隠れ層の情報を活用した教師あり手法を提案する。この手法は、LLMの出力に関する確率情報と隠れ層の活性化値を特徴量として使い、不確実性スコアを予測する。この手法は、ブラックボックス、グレーボックス、ホワイトボックスのLLMに適用可能である。
実験では、質問応答、機械翻訳、多肢選択の各タスクでこの手法の性能を評価し、既存手法と比較する。その結果、LLMの隠れ層の情報を活用することで、様々なタスクにおいて不確実性推定の性能が向上することが示された。さらに、不確実性推定と不確実性較正の関係についても分析し、提案手法が両者の性能向上に寄与することを明らかにした。
เป็นภาษาอื่น
จากเนื้อหาต้นฉบับ
arxiv.org
ข้อมูลเชิงลึกที่สำคัญจาก
by Linyu Liu,Yu... ที่ arxiv.org 04-25-2024
https://arxiv.org/pdf/2404.15993.pdfสอบถามเพิ่มเติม