核心概念
提案されたInfinite-IDは、IDセマンティクスの切り離しパラダイムを介して、単一の参照画像で高品質な画像を合成し、優れたアイデンティティの忠実度とテキストの意味的整合性を維持します。
摘要
最近の拡散モデルに基づく最新技術を活用して、個別のアイデンティティを正確に捉えることに重点を置いた個人化された写真生成が進歩しています。
Infinite-IDは、IDセマンティクスの切り離しパラダイムを提案し、アイデンティティ保持型個人化における高い忠実度と意味的整合性のバランスを取得します。
新しい特徴相互作用メカニズムが導入され、生成された画像のスタイルを便利に制御するだけでなく、アイデンティティと意味的詳細の忠実度も向上させます。
Introduction:
Identity-preserved personalization aims to produce highly customized photos reflecting specific identities.
Existing methods face challenges in balancing identity fidelity and semantic consistency.
Infinite-ID proposes a novel approach to address these challenges.
Methodology:
Identity-enhanced training captures high-fidelity identity separately from text information.
Mixed attention mechanism seamlessly merges semantic and identity information.
AdaIN-mean operation aligns style of synthesized images with desired style prompts.
Experiments:
Extensive experiments demonstrate superior performance in raw photo generation and style image generation tasks.
Ablation studies show the impact of identity-enhanced training, mixed attention mechanism, and AdaIN-mean operation.
統計資料
提案された方法はIdentity Fidelity(MFaceNet:0.913)、Semantic Consistency(CLIP-T:0.340)で他手法よりも優れています。
引述
"Extensive experimental results on both raw photo generation and style image generation demonstrate the superior performance of our proposed method."