Centrala begrepp
高次ランジュバン動力学を用いた新しい高品質かつ高速な生成モデリング手法を提案する。これにより、位置、速度、加速度を同時にモデル化することで、データ生成の質と速度を向上させることができる。
Sammanfattning
本論文では、高次ランジュバン動力学(HOLD)に基づく新しい生成モデリング手法を提案している。
HOLD は、位置、速度、加速度の3つの変数を同時にモデル化することで、データ生成の質と速度を向上させることができる。具体的には、以下のような特徴がある:
- 位置変数は、速度と加速度を介して間接的にしか Brownian motion に依存しないため、より滑らかな生成パスが得られる。
- HOLD は、オーナスタイン・ウーレンベック過程と2つのハミルトン系から構成されており、これにより混合時間を2桁改善できる。
- 提案手法は、CIFAR-10 や CelebA-HQ などの公開ベンチマークデータセットで、既存手法を上回る性能を示している。特に、同等の計算リソースの下で、提案手法の方が優れた性能を発揮する。
全体として、HOLD に基づく生成モデリングは、高品質かつ高速なデータ生成を実現できる新しい手法であると言える。
Statistik
位置変数 q は速度変数 p と加速度変数 s を介して Brownian motion に依存するため、より滑らかな生成パスが得られる。
HOLD は、オーナスタイン・ウーレンベック過程と2つのハミルトン系から構成されており、これにより混合時間を2桁改善できる。
提案手法は、CIFAR-10 で FID 1.85、CelebA-HQ で高品質な顔画像を生成できる。
Citat
"HOLD can simultaneously model position, velocity, and acceleration, thereby improving the quality and speed of the data generation at the same time."
"HOLD is composed of one Ornstein-Uhlenbeck process and two Hamiltonians, which reduce the mixing time by two orders of magnitude."
"On the CIFAR-10 and CelebA real-world image modelling task, HOLD-based DGM outperforms various state-of-the-art methods in synthesis quality under similar computation resources."