この技術報告は、2つの肖像画像間での顔交換のための拡散モデルに基づくフレームワークを紹介しています。IP-Adapter、ControlNet、およびStable Diffusionのinpaintingパイプラインという3つのコンポーネントからなる基本的なフレームワークが含まれています。さらに、顔特徴エンコード、多条件生成、および顔inpaintingのためにそれぞれFacial Guidance OptimizationとCodeFormer based blendingを導入して生成品質をさらに向上させます。実験ではCelebA-HQで行われ、顔整列とアイデンティティ忠実度が定量的に示されます。カスタマイズ方法や画像エンコーディングなど、各設計の詳細も提供されています。
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Feifei Wang a las arxiv.org 03-05-2024
https://arxiv.org/pdf/2403.01108.pdfConsultas más profundas