핵심 개념
事前学習済みのディフュージョンモデルの内在的な能力を活用し、セマンティックマニピュレーションを通じて、一貫したキャラクター生成を実現する。
초록
本論文は、一貫したキャラクター生成のための新しいクラスター条件付きパラダイム「OneActor」を提案している。
- 潜在空間上のサンプルがクラスターを形成することに着目し、クラスター基準のスコア関数を導出した。
- クラスター条件付きモデルを構築し、ターゲットクラスターへの収束を促すための軽量なプロジェクターを学習する。
- 過剰適合の課題に対処するため、ターゲットとオーキシリアルサンプルを組み合わせた損失関数を設計した。
- セマンティック補間の性質を発見・活用し、一貫性と多様性のバランスを取ることができる。
- 実験の結果、提案手法は一貫性、プロンプト適合性、画質において優れた性能を示し、チューニング時間も大幅に短縮できることが確認された。
통계
事前学習済みのディフュージョンモデルの潜在空間上のサンプルは、異なる概念に対応する基本クラスターと、同一概念内の外観の共通性に基づくアイデンティティサブクラスターを形成する。
提案手法のチューニングには、ターゲットサンプルとオーキシリアルサンプルを組み合わせた損失関数を使用し、過剰適合を抑制する。
セマンティック空間とラテント空間は同様の補間特性を持つことを発見し、生成画像の一貫性と多様性のバランスを取ることができる。
인용구
"事前学習済みのディフュージョンモデルの内在的な能力を活用し、セマンティックマニピュレーションを通じて、一貫したキャラクター生成を実現する。"
"クラスター条件付きモデルを構築し、ターゲットクラスターへの収束を促すための軽量なプロジェクターを学習する。"
"セマンティック空間とラテント空間は同様の補間特性を持つことを発見し、生成画像の一貫性と多様性のバランスを取ることができる。"