Core Concepts
提案されたCoarse-to-Fine Latent Diffusion(CFLD)方法は、Pose-Guided Person Image Synthesis(PGPIS)において高度な画像生成能力を持ち、過学習の問題を回避するために微細な外観とポーズ情報の制御を分離します。
Abstract
この論文では、Coarse-to-Fine Latent Diffusion(CFLD)方法が提案され、Pose-Guided Person Image Synthesis(PGPIS)における画像生成の新しいアプローチを示しています。PRDとHGAモジュールにより、人物画像の高レベルな意味理解が可能であり、テクスチャの詳細も保持しつつ粗から細まで学習することができます。実験結果は、CFLDがPGPISにおいて他の手法を圧倒し、定量的・定性的に優れた結果を達成しています。
Stats
1000ステップの前進拡散プロセスと後退除去プロセス
256×176および512×352解像度でのDeepFashionデータセット上での評価
Quotes
"Both quantita-tive and qualitative experimental results on the DeepFash-ion benchmark demonstrate the superiority of our method over the state of the arts for PGPIS."
"Our main contributions can be summarized as follows."