Effiziente Bildgenerierung durch selektives Caching von Kreuzaufmerksamkeit in Text-zu-Bild-Diffusionsmodellen
Kreuzaufmerksamkeit ist in den frühen Inferenzschritten von Text-zu-Bild-Diffusionsmodellen entscheidend, kann aber in späteren Schritten durch Caching und Wiederverwendung der Kreuzaufmerksamkeitskarten erheblich beschleunigt werden, ohne die Bildqualität zu beeinträchtigen.