本論文では、U-Sketchと呼ばれる新しいスケッチ指導型テキスト-画像合成フレームワークを提案している。U-Sketchの中核となるのは、U-Netタイプの潜在エッジ予測器である。この予測器は、中間層の活性化を利用して、各脱ノイズステップでエッジマップを推定し、合成プロセスを指導する。
U-Sketchの主な特徴は以下の通り:
実験結果と、ユーザーからのフィードバックから、U-Sketchが優れた性能を発揮することが示された。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Ilias Mitsou... at arxiv.org 03-28-2024
https://arxiv.org/pdf/2403.18425.pdfDeeper Inquiries