拡散モデルの推論を高速化するために、エンコーダの出力が時間ステップ間でほとんど変化しないという特性を利用し、デコーダの計算を並列化する手法を提案する。
本稿では、拡散モデルの推論を高速化するために、新しい蒸留手法であるリレーショナル拡散蒸留(RDD)を提案する。RDDは、画素レベルや特徴分布の単純なアラインメントではなく、サンプル間の関係性を考慮した蒸留を行うことで、従来手法よりも高品質な画像を高速に生成することができる。
拡散トランスフォーマーにおいて、トークンごとに異なる特徴キャッシング戦略を用いることで、生成品質を維持しながら高速化を実現できる。
本論文では、確率的ルンゲ・クッタ法に基づく、SDEベースの拡散サンプラーのためのトレーニングフリーな高速化アルゴリズムを提案し、分析する。提案されたサンプラーは、従来の保証よりも次元依存性の観点から強化された、ε^2の誤差(KLダイバージェンスで測定)を、e^O(d^(3/2)/ε)回のスコア関数評価を使用して達成することを証明する(εが十分に小さい場合)。
本稿では、拡散モデルの高速化手法として、1対多知識蒸留(O2MKD)を提案する。これは、1つの教師モデルの知識を、連続した時間ステップのサブセットを学習する複数の生徒モデルに蒸留する。これにより、従来の知識蒸留や高速サンプリング手法と組み合わせることで、大幅な高速化を実現できる。
拡散モデルの反復的な除雑音処理に潜在する時間的な冗長性を活用することで、出力品質を損なうことなく計算コストを大幅に削減できる。
SCottは、拡散モデルに確率的一貫性蒸留を導入し、高品質な画像生成を実現する。