Core Concepts
大規模ビジョン言語モデルにおける幻覚の検出と軽減を、細粒度AIフィードバックを用いて実現する。
Abstract
本研究では、大規模ビジョン言語モデル(LVLM)における幻覚の検出と軽減を、細粒度AIフィードバックを用いて行う。具体的には以下の4つのコンポーネントから成る:
細粒度AIフィードバック: GPT-4やGPT-4Vを用いて、文レベルの幻覚アノテーションデータセットを生成する。
細粒度AIフィードバックによる幻覚検出モデルの訓練: 生成したアノテーションデータセットを用いて、文レベルの幻覚検出モデルを訓練する。このモデルは、オブジェクト、属性、関係といった主要な幻覚タイプを検出できる。
検出-書き換えパイプラインによる好みデータセットの自動構築: 幻覚検出モデルと書き換えモデルを組み合わせ、幻覚応答を非幻覚応答に自動的に書き換えることで、好みデータセットを効率的に構築する。
幻覚の重大さを考慮したDPO: 幻覚の重大さを考慮したDPO(Hallucination Severity-Aware Direct Preference Optimization)を提案し、重大な幻覚の軽減を優先する。
実験の結果、提案手法は幻覚検出と軽減の両面で優れた性能を示し、大規模ビジョン言語モデルの信頼性向上に寄与することが確認された。
Stats
幻覚の重大度が高い応答ほど、より大きな重みが付与される。
幻覚の重大度の平均スコアは、LLaVA-1.5-13bが0.796、LLaVA w/ HSA-DPOが0.620である。
Quotes
大規模ビジョン言語モデルにおける幻覚は、生成された文章が与えられたコンテキストと整合しないという深刻な問題を引き起こしている。
従来の研究では、幻覚の検出と軽減に高コストな人手アノテーションや専有モデルが必要とされていた。