本論文は、大規模言語モデル(LLM)の事前学習版と微調整版の尤度比を用いて、分布外(OOD)データを検出する手法を提案している。
主な内容は以下の通り:
LLMは事前学習時に広範な知識を獲得しているため、事前学習版のLLMと微調整版のLLMの尤度比を用いると、OOD検出に効果的である。
提案手法は、質問応答(QA)システムにおいて、OOD質問を検出するのに有効である。OOD質問を除外することで、QAシステムの堅牢性が向上する。
様々な実験設定(遠距離OOD、近距離OOD、スパム検出、QA)で提案手法の有効性を示した。特に、遠距離OODでは完璧に近い性能を示した。
尤度を損失関数から容易に得られるため、提案手法は簡単に実装できる。また、事前学習LLMと微調整LLMが既に利用可能な場合、さらに追加の学習は不要である。
Na inny język
z treści źródłowej
arxiv.org
Głębsze pytania