Concetti Chiave
MLLMのバイアスを軽減し、視覚情報への基盤を向上させるためにBootstrapped Preference Optimization(BPO)が効果的である。
Statistiche
マルチモーダル大言語モデル(MLLM)はバイアスに苦しんでいる (Abstract)
MLLMは画像入力に基づく応答生成時にエラーまたは幻想的な応答を生じやすい (Introduction)
BPOは事前トレーニングバイアスを抑制し、視覚情報への基盤を向上させる (Bootstrapped Preference Learning)
Citazioni
"MLLMs often generate non-existent objects, incorrectly identify attributes such as shape or color, or provide inaccurate object counts."
"Our approach leads to significant performance improvements across multiple benchmarks and advancing the state-of-the-art in multimodal conversational systems."