PAIR Diffusion ist ein generisches Framework, das es Diffusions-Modellen ermöglicht, die Struktur und das Erscheinungsbild jedes Objekts in einem Bild unabhängig voneinander zu steuern. Dadurch können verschiedene Bildbearbeitungsaufgaben wie lokalisierte formfreie Formbearbeitung, Erscheinungsbearbeitung, gleichzeitiges Bearbeiten von Form und Erscheinungsbild, kontrolliertes Hinzufügen von Objekten und objektbasierte Bildvariationen durchgeführt werden.
Durch den Einsatz von Großen Multimodalen Modellen (LMM) kann die Künstliche Intelligenz Bilder sicher und ethisch anpassen, indem sie abstrakte Konzepte versteht und gezielt Änderungen plant.
ByteEdit ist ein innovatives Feedback-Lernframework, das darauf abzielt, die Qualität, Konsistenz und Inferenzgeschwindigkeit bei diffusionsbasierten generativen Bildbearbeitungsaufgaben zu verbessern.
GANTASTIC ist ein neuartiger Ansatz, der die disentangelten Bearbeitungsfähigkeiten von GANs mit der hervorragenden Bildgenerierung von Diffusionsmodellen wie Stable Diffusion kombiniert, indem es interpretierbare Richtungen direkt von vortrainierten GAN-Modellen auf Diffusionsmodelle überträgt.
Ground-A-Score ist eine einfache, aber leistungsstarke modellunabhängige Methode zum Bildediting, die das Grounding während der Score-Destillation nutzt, um die komplexen Anforderungen des Benutzers präzise in den Ergebnissen widerzuspiegeln.