Core Concepts
Kontrollierbare regionale Bildunterschriften (ControlCap) adressieren das Problem der Bildunterschriften-Degeneration durch die Einführung von Steuerungswörtern in multimodellen Modellen.
Abstract
Regionale Bildunterschriften sind eine herausfordernde Aufgabe, die durch die Bildunterschriften-Degeneration beeinträchtigt wird.
ControlCap nutzt ein diskriminatives Modul, um Steuerungswörter zu generieren und die Bildunterschriften in verschiedene Teilräume zu unterteilen.
Die vorgeschlagene Methode verbessert die CIDEr-Werte auf Visual Genome und RefCOCOg Datensätzen signifikant.
Stats
In dieser Studie wird gezeigt, dass ControlCap die CIDEr-Werte auf Visual Genome und RefCOCOg Datensätzen um 21,6 bzw. 2,2 verbessert.