Khái niệm cốt lõi
部分経路線形近似モデル(SLAM)は、確率流(PF) ODEの部分経路に沿って線形補間を行うことで、効率的な学習目的関数を設計し、従来の加速手法よりも高品質な画像生成を実現する。
Tóm tắt
本論文は、確率流(PF) ODEに基づく拡散モデルの高速化手法を提案している。従来の加速手法では、PF-ODE経路上の点間の近似誤差の蓄積が課題となっていた。
提案手法のSLAMは以下の特徴を持つ:
- PF-ODE経路を部分経路に分割し、各部分経路を線形補間で近似するSub-path Linear (SL) ODEを導入する。
- SL-ODEに基づいて、部分経路の学習目的関数を段階的かつ連続的に最適化することで、累積近似誤差を低減する。
- 事前学習済みの潜在拡散モデル(Stable Diffusion)を効率的に蒸留する手法を開発し、高品質な画像生成を実現する。
実験結果では、提案手法SLAMが既存の加速手法を大きく上回る性能を示し、わずか6日間のトレーニングで高品質な生成モデルを得られることを確認した。
Thống kê
提案手法SLAMは、わずか6日間のトレーニングで高品質な生成モデルを得られる。
SLAMは、既存の加速手法と比べて、LAION、MS COCO 2014、MS COCO 2017データセットにおいて、FIDとCLIP Scoreの両指標で優れた性能を示す。
Trích dẫn
"部分経路線形近似モデル(SLAM)は、確率流(PF) ODEの部分経路に沿って線形補間を行うことで、効率的な学習目的関数を設計し、従来の加速手法よりも高品質な画像生成を実現する。"
"SLAMは、わずか6日間のトレーニングで高品質な生成モデルを得られる。"