NoiseCollageは、個々のオブジェクトに独立してノイズを推定し、それらを1つのノイズに結合することで、画像生成時に条件不一致を回避します。この操作は、テキスト条件が対応するオブジェクトに正確に配置されることを可能にします。また、ControlNetと統合することで、エッジやスケッチなどの追加条件を使用してレイアウトの精度を向上させます。
Qualitative and quantitative evaluations show that NoiseCollage outperforms several state-of-the-art models. These results indicate that the crop-and-merge operation of noises is a reasonable strategy to control image generation.
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Takahiro Shi... kl. arxiv.org 03-07-2024
https://arxiv.org/pdf/2403.03485.pdfDybere Forespørgsler