本文提出了一種名為幻覺誘導優化 (HIO) 的新型優化策略,透過增強幻覺詞彙與目標詞彙之間的對比,有效減輕大型視覺語言模型 (LVLM) 中的幻覺現象。
本文提出了一種名為自我反思解碼(SID)的新型解碼策略,旨在通過利用預先訓練好的大型視覺語言模型(LVLMs)內省評估視覺資訊重要性的能力,來減輕 LVLMs 中的幻覺現象。