この技術報告は、2つの肖像画像間での顔交換のための拡散モデルに基づくフレームワークを紹介しています。IP-Adapter、ControlNet、およびStable Diffusionのinpaintingパイプラインという3つのコンポーネントからなる基本的なフレームワークが含まれています。さらに、顔特徴エンコード、多条件生成、および顔inpaintingのためにそれぞれFacial Guidance OptimizationとCodeFormer based blendingを導入して生成品質をさらに向上させます。実験ではCelebA-HQで行われ、顔整列とアイデンティティ忠実度が定量的に示されます。カスタマイズ方法や画像エンコーディングなど、各設計の詳細も提供されています。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Feifei Wang at arxiv.org 03-05-2024
https://arxiv.org/pdf/2403.01108.pdfDeeper Inquiries