本論文では、U-Sketchと呼ばれる新しいスケッチ指導型テキスト-画像合成フレームワークを提案している。U-Sketchの中核となるのは、U-Netタイプの潜在エッジ予測器である。この予測器は、中間層の活性化を利用して、各脱ノイズステップでエッジマップを推定し、合成プロセスを指導する。
U-Sketchの主な特徴は以下の通り:
実験結果と、ユーザーからのフィードバックから、U-Sketchが優れた性能を発揮することが示された。
Para outro idioma
do conteúdo fonte
arxiv.org
Principais Insights Extraídos De
by Ilias Mitsou... às arxiv.org 03-28-2024
https://arxiv.org/pdf/2403.18425.pdfPerguntas Mais Profundas