Core Concepts
Hyper-SDは、ODEの軌跡保持と軌跡再構築の利点を融合し、ステップ圧縮時の性能劣化を最小限に抑えるための新しいフレームワークを提案する。
Abstract
本論文では、Hyper-SDと呼ばれる新しいフレームワークを提案している。Hyper-SDは以下の3つの主要な特徴を持つ:
軌跡分割一貫性蒸留(TSCD): 時間ステップを細かいセグメントに分割し、各セグメントで一貫性を保ちながら、徐々にセグメント数を減らすことで全体の一貫性を達成する。これにより、モデルの適合性能の限界と推論時の累積誤差による性能劣化を解決する。
人間フィードバック学習: 美的嗜好と知覚的構造に基づくフィードバックを活用し、少ステップ推論時の性能を大幅に向上させる。
ワンステップ生成の強化: 分布マッチング蒸留と統一的なLoRAを導入し、ワンステップ推論時の性能を最適化する。
これらの手法を組み合わせることで、Hyper-SDは既存の加速手法と比べて、1ステップから8ステップの範囲で圧倒的な性能を発揮する。特に1ステップ推論時には、従来手法を大きく上回る結果を示している。
Stats
提案手法Hyper-SDは、従来手法と比べて1ステップ推論時のCLIPスコアを+0.68、美的スコアを+0.51向上させた。
Hyper-SDは、4ステップ推論時においても、従来手法を上回るCLIPスコア、美的スコア、ImageReward、Pickスコアを達成した。
Quotes
"Hyper-SDは、ODEの軌跡保持と軌跡再構築の利点を融合し、ステップ圧縮時の性能劣化を最小限に抑えるための新しいフレームワークを提案する。"
"Hyper-SDは、1ステップから8ステップの範囲で圧倒的な性能を発揮する。特に1ステップ推論時には、従来手法を大きく上回る結果を示している。"