核心概念
新しい進行的敵対的拡散蒸留方法により、SDXLに基づく1ステップ/数ステップの1024pxテキストから画像生成で最新の成果を達成します。
要約
ByteDance Inc.によるSDXL-Lightningは、進行的および敵対的な蒸留を組み合わせて、品質とモードカバレージのバランスを実現する拡散蒸留方法を提案しています。この手法は、理論分析、識別器設計、モデル形式化、およびトレーニング技術に焦点を当てています。また、LoRAと完全なUNetウェイトとして彼らの蒸留されたSDXL-Lightningモデルをオープンソースで提供しています。拡散モデルは慎重な推定が必要であり、高品質なデータサンプルの生成には50回以上の推論ステップが必要です。これに対し、モデル蒸留は10回未満の推論ステップで高品質なサンプルを実現します。彼らの手法は既存の手法と比べて優れた品質を達成しました。
統計
SDXL-Lightningは1ステップ/数ステップで1024px解像度で生成可能。
50回以上の推論ステップが必要。
モデル蒸留では10回未満の推論ステップで高品質なサンプルが得られる。