핵심 개념
Zero-shot localized multi-object editing through a multi-diffusion process.
초록
最近の拡散モデルの発展により、高品質なプロンプト条件付き画像編集を生成する能力が示されています。しかし、従来のアプローチは主にテキストプロンプトに依存しており、特定のオブジェクトや微細な領域に正確な編集を行う際に効果が低い傾向があります。本研究では、ゼロショットの局所化マルチオブジェクト編集フレームワークを導入し、この課題を克服します。このフレームワークは、マスクと対応する単純なテキストプロンプトを利用して、ターゲット領域に局所的な影響を及ぼし、高忠実度の画像編集を実現します。
통계
代表的な結果:LoMOEは多様な画像で単一およびマルチオブジェクトの編集を1回で処理可能。
フレームワーク名:LoMOE(Localized Multi-Object Editing)。
新しいデータセット:LoMOE-Bench。
実験結果:既存の最先端手法と比較して、LoMOEアプローチの効果的性能向上が示された。
인용구
"Recent developments in the field of diffusion models have demonstrated an exceptional capacity to generate high-quality prompt-conditioned image edits."
"Our method can handle intricate localized object details such as heart color, earrings, window-view, multiple-cloud coloring, animal types in a painting, and tree-animal type."
"We present a framework called LoMOE for zero-shot text-based localized multi-object editing based on Multi-diffusion."
"Our framework facilitates multiple edits in a single iteration via enforcement of cross-attention and background preservation, resulting in high fidelity and coherent image generation."