Baixe o Linnk AI
•
Assistente de Pesquisa
>
Entrar
insight
-
大型多模态模型的图像感知能力
大型语言模型利用扩散模型作为图像感知的"眼睛"
扩散模型可以作为大型语言模型的"眼睛",通过生成性反馈来校正图像编码器的语义偏差,从而增强多模态模型的鲁棒性和减少视觉幻觉。
1