Logische Informationen in Bildern erfassen und nutzen: Eine Methode zur Verbesserung der Bildgenerierung
Logische Informationen spielen eine wichtige Rolle beim Verständnis und der Verarbeitung von Bildern. Allerdings haben fast alle Modelle die Bedeutung logischer Beziehungen in Bildern vernachlässigt, was zu schlechter Leistung in diesem Bereich führt. Wir stellen LogicalDefender vor, eine Methode, die Bilder mit bereits vom Menschen zusammengefassten logischen Kenntnissen in Textform kombiniert. Dies ermöglicht es Modellen, logisches Wissen schneller und besser zu lernen und gleichzeitig weit anwendbare logische Kenntnisse aus Bildern und menschlichem Wissen zu extrahieren.