Der Artikel stellt eine neue Methode namens "FRDiff" vor, die die Leistung von Diffusionsmodellen durch Feature-Wiederverwendung deutlich verbessert. Diffusionsmodelle benötigen viele Iterationsschritte, um hochwertige Bilder zu generieren, was zu hohen Rechenkosten führt. FRDiff nutzt die zeitliche Redundanz in den Zwischenergebnissen der Diffusionsmodelle, um Berechnungen einzusparen, ohne die Bildqualität zu beeinträchtigen.
Der Artikel analysiert zunächst die zeitliche Ähnlichkeit der Zwischenergebnisse in verschiedenen Diffusionsmodell-Architekturen. Darauf aufbauend wird die Feature-Reuse-Methode entwickelt, die selektiv Zwischenergebnisse wiederverwenden kann. Um die Vorteile von Feature-Reuse und reduzierten Iterationsschritten zu kombinieren, wird außerdem eine "Score-Mischung" eingeführt. Zusätzlich wird ein automatisches Verfahren namens "Auto-FR" präsentiert, das die optimale Konfiguration für Feature-Reuse ermittelt.
Umfangreiche Experimente auf verschiedenen Datensätzen und Diffusionsmodell-Architekturen zeigen, dass FRDiff eine Beschleunigung von bis zu 1,76x erreichen kann, ohne die Bildqualität zu beeinträchtigen. Damit übertrifft FRDiff bestehende Beschleunigungsmethoden deutlich.
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問