核心概念
画像合成における高解像度マルチアスペクト画像生成を可能にする新しい潜在的敵対的拡散蒸留(LADD)手法が導入されました。
摘要
Abstract:
拡散モデルは画像とビデオ合成の進歩を牽引していますが、推論速度が遅いという欠点があります。
最近導入された敵対的拡散蒸留(ADD)などの蒸留手法は、多数のショットから単一ステップ推論への移行を目指しています。
Introduction:
拡散モデルは反復的にガウスノイズをデータに変換することを学習します。
多くのアプリケーションでは、t=0での最終分布に興味があるため、多くの蒸留技術が試みられています。
Method:
LADDは低次元潜在空間を活用し、大規模なモデルサイズや高解像度で効率的な訓練を実現します。
Experiments:
学生モデルサイズがパフォーマンスに大きな影響を与えることが示されました。
Comparison to State-of-the-Art:
SD3-Turboは4つのサンプリングステップでSD3と同等の画質を達成しました。
統計資料
敵対的拡散蒸留(ADD)は現在、単一ステップ合成における最先端手法です。 (Source: Abstract)
LCM-LORAよりもLADDが優れた結果を示す。 (Source: Method)
学生モデルサイズがパフォーマンスに大きな影響を与えることが示されました。 (Source: Experiments)