Verbesserung der Leistung von großen multimodalen Modellen durch selbstgesteuertes Feedback-basiertes Überarbeiten
Großen multimodalen Modellen gelingt es oft nicht, die visuellen Informationen in ihren Antworten korrekt widerzuspiegeln, was zu multimodaler Halluzination führt. VOLCANO, ein multimodales Selbstfeedback-gesteuertes Überarbeitungsmodell, kann diese Halluzination effektiv reduzieren, indem es natürlichsprachliches Feedback zur Verbesserung seiner Antworten nutzt.