本論文は、効率的な高解像度画像生成手法「ECDP」を提案している。
まず、連続時間の条件付き拡散モデルを設計し、確率流サンプリングを用いることで、高速な高解像度画像生成を実現している。従来の拡散モデルは反復的なサンプリングを必要としていたため、時間がかかっていた。
次に、ノイズ成分を予測するϵ-パラメータ化と清浄画像を予測するx0-パラメータ化を組み合わせたハイブリッド・パラメータ化を提案している。これにより、ノイズの少ない領域とノイズの多い領域の両方で高精度な予測が可能となり、生成画像の一貫性が向上する。
さらに、生成画像の品質を直接最適化するための画質損失関数を導入している。従来の拡散モデルは間接的な最適化しか行っていなかったが、この損失関数を用いることで、生成画像の品質がさらに向上する。
実験では、DIV2K、ImageNet、CelebAデータセットを用いて評価を行い、提案手法が既存の拡散モデルベースの手法よりも高解像度画像の品質が高く、かつ高速であることを示している。
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문