本論文は、大規模言語モデル(LLM)の故障検出に関する研究を行っている。
まず、既存の故障検出手法をLLMに適用した結果、それらの手法はLLMの故障を効果的に検出できないことを示した。その理由は、LLMの予測が過度に自信を持っていることが原因であると分析した。
そこで、本研究では、プロンプトの変異に基づいて予測信頼度をスムージングするMuCS手法を提案した。具体的には、入力プロンプトを変異させて複数のバージョンを生成し、それらの平均予測信頼度を用いて故障検出を行う。
実験の結果、MuCSを用いることで、既存の故障検出手法の性能を最大97.64%改善できることが示された。これは、MuCSがLLMの過度な自信を適切に調整し、故障検出の精度を大幅に向上させることができることを意味している。
本研究は、LLMの信頼性向上に向けた重要な一歩となっている。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問