Concepts de base
前処理済みT2Iモデルに新しいアイデンティティを挿入するための以前の方法には、2つの問題があります。1つ目はAttention Overfitであり、2つ目はSemantic-Fidelityの制限です。これらの問題を解決するために、Face-Wise Region FitとSemantic-Fidelity Token Optimizationを提案します。
Stats
Previous methods for inserting new identities (IDs) into pre-trained Text-to-Image diffusion models have two problems.
Attention Overfit: Activation maps of Textural Inversion and ProSpect show that their attention nearly takes over the whole images, limiting generative ability.
Limited Semantic-Fidelity: Celeb Basis introduces excessive face prior, hindering semantic-fidelity of learned ID embedding.