Effiziente und ressourcenschonende Methode zur Erstellung personalisierter Text-zu-Bild-Generierung unter Verwendung von CLIP-Latenzräumen
λ-ECLIPSE ist eine effiziente Methode zur Erstellung personalisierter Text-zu-Bild-Generierung, die den CLIP-Latenzraum nutzt, ohne auf diffusionsbasierte Modelle angewiesen zu sein. Durch ein bildtext-interleaved Vortraining kann λ-ECLIPSE Konzept- und Kompositionsausrichtung bei deutlich geringerem Ressourcenverbrauch als bestehende Ansätze erreichen.