Core Concepts
Unser Ansatz Adaptive Style Incorporation (ASI) ermöglicht eine feingranulare, strukturkonsistente Stilübertragung auf Merkmalsebene, ohne dass eine Anpassung oder Feinabstimmung des Diffusionsmodells erforderlich ist.
Abstract
In dieser Arbeit untersuchen wir die textgesteuerte Stilübertragung im Kontext von Text-zu-Bild-Diffusionsmodellen. Die Hauptherausforderung besteht darin, die Strukturkonsistenz beizubehalten, während gleichzeitig effektive Stilübertragungseffekte erzielt werden. Bisherige Ansätze in diesem Bereich haben den Inhalts- und Stilprompt direkt verkettet, um eine promptbasierte Stileinbindung zu erreichen, was jedoch zu unvermeidlichen Strukturverzerrungen führt.
Wir schlagen eine neuartige Lösung für die Aufgabe der textgesteuerten Stilübertragung vor, nämlich Adaptive Style Incorporation (ASI), um eine feingranulare Stileinbindung auf Merkmalsebene zu erreichen. ASI besteht aus der Siamese Cross-Attention (SiCA), um die einzelne Kreuzaufmerksamkeit in eine Dual-Track-Architektur aufzuteilen, um separate Inhalts- und Stilmerkmale zu erhalten, sowie dem Adaptive Content-Style Blending (AdaBlending)-Modul, um die Inhalts- und Stilinformationen auf eine strukturkonsistente Art und Weise zu koppeln.
Unsere experimentellen Ergebnisse zeigen, dass unser Verfahren deutlich bessere Leistungen sowohl bei der Strukturerhaltung als auch bei den stilisierten Effekten erzielt.
Stats
Keine relevanten Statistiken oder Kennzahlen identifiziert.
Quotes
Keine relevanten Zitate identifiziert.