本論文では、拡散確率モデルの逆プロセスを根本的に改善するために、従来のU-Netディノイジングネットワークを独自の連続U-Netアーキテクチャに置き換えることを提案している。この新しいディノイジングネットワークには、残差接続とタイムエンベディングを備えた独自の2次のニューラルODEブロックが特徴的である。これにより、効率性、収束速度、ノイズに対するロバスト性が向上する。
実験では、画像合成タスクにおいて従来モデルと同等の性能を示しつつ、逆プロセスの推論時間が短縮されることを確認した。また、ディノイジング性能においても、従来モデルを上回る結果が得られた。さらに、パラメータ数が4分の1に削減されるなど、大幅な効率化が実現された。
本手法は、既存の性能向上手法と互換性があり、さらなる効率化、品質向上、高速化が期待できる。また、MRI再構成、オーディオ生成、画像セグメンテーション、合成データ生成など、他の分野でも活用できる可能性がある。
Egy másik nyelvre
a forrásanyagból
arxiv.org
Mélyebb kérdések