Detailliertes Feedback für die Verbesserung von Text-zu-Bild-Generierung
Durch die Sammlung von detailliertem menschlichen Feedback auf generierten Bildern, einschließlich Markierungen von Regionen mit Artefakten/Unplausibilität und Textmissalignment sowie Bewertungen der Plausibilität, Textausrichtung, Ästhetik und Gesamtqualität, können Modelle entwickelt werden, die diese Aspekte automatisch vorhersagen und so die Qualität der generierten Bilder verbessern können.