Centrala begrepp
LVLMsにおける物体幻覚を軽減するためのLUREアルゴリズムの提案と効果的な結果を示す。
Statistik
LVLMsにおける物体幻覚を軽減する方法としてLUREアルゴリズムが提案されています。
LUREは共起、不確実性、オブジェクト位置などの要因に基づいて訓練されます。
LUREは6つのオープンソースLVLMsで効果的であることが示されています。
Citat
"Large vision-language models (LVLMs) have shown remarkable abilities in understanding visual information with human languages."
"LARGE VISION-LANGUAGE MODELS (LVLMs) have made significant progress in understanding real-world images."
"LURE is grounded in a rigorous statistical analysis of the key factors underlying object hallucination."