Keskeiset käsitteet
提案手法MC2は、別々に訓練された異種のシングルコンセプトカスタマイズモデルを統合し、複数のカスタマイズされたコンセプトの自然な合成を可能にする。追加の訓練なしで、柔軟性と忠実度の向上を実現する。
Tiivistelmä
本論文では、マルチコンセプトカスタマイズ生成のための新しい手法MC2を提案する。MC2は、別々に訓練された異種のシングルコンセプトカスタマイズモデルを統合し、複数のカスタマイズされたコンセプトの自然な合成を可能にする。
まず、複数のパラレルな拡散モデルを使用し、それぞれにカスタマイズモジュールを持たせる。次に、マルチコンセプトガイダンス(MCG)を各拡散ステップで実行する。MCGは、視覚トークンと言語トークンの注意重みを適応的に調整し、各コンセプトに関連付けられた領域に注目させ、関連のない領域の影響を抑える。これにより、別々に訓練されたカスタマイズモデルを統合して、複数のカスタマイズされたコンセプトを同時に生成できる。
さらに、MCGの考え方を応用して、既存のテキストから画像への拡散モデルの合成能力を向上させることができる。
実験の結果、提案手法MC2は、追加の訓練なしで、既存手法を上回るカスタマイズされたマルチコンセプト生成の忠実度を示した。また、合成生成能力の向上にも効果的であることが確認された。
Tilastot
拡散モデルの各ステップで、視覚トークンと言語トークンの注意重みを適応的に調整することで、各コンセプトに関連付けられた領域に注目させ、関連のない領域の影響を抑えることができる。
提案手法MC2は、別々に訓練された異種のシングルコンセプトカスタマイズモデルを統合して、複数のカスタマイズされたコンセプトを同時に生成できる。
MCGの考え方を応用することで、既存のテキストから画像への拡散モデルの合成能力を向上させることができる。
Lainaukset
"MC2 decouples the requirements for model architecture via inference time optimization, allowing the integration of various heterogeneous single-concept customized models."
"MC2 adaptively refines the attention weights between visual and textual tokens, directing image regions to focus on their associated words while diminishing the impact of irrelevant ones."
"Extensive experiments demonstrate that MC2 even surpasses previous methods that require additional training in terms of consistency with input prompt and reference images."