本論文では、ローリング拡散モデルと呼ばれる新しい拡散モデルフレームワークを提案している。従来の拡散モデルは、時系列データの各フレームに対して同じ量のノイズを加えていたが、ローリング拡散モデルでは、時間方向にノイズ量を徐々に増加させることで、時間の経過に伴う不確定性を反映している。
具体的には、拡散時間tを各フレームの局所的な時間tkにリパラメータリゼーションすることで実現している。これにより、各フレームに対して適応的にノイズ量を制御できるようになる。また、過去のフレームと未来のフレームを同時に生成することで、時間方向の依存関係をうまく捉えることができる。
実験では、複雑な時系列データである動画予測タスクやカオス流体力学シミュレーションなどで、ローリング拡散モデルが従来手法を上回る性能を示すことを確認している。特に、時間方向の変化が激しい場合に顕著な効果が見られた。
Na inny język
z treści źródłowej
arxiv.org
Głębsze pytania