本論文では、U-Sketchと呼ばれる新しいスケッチ指導型テキスト-画像合成フレームワークを提案している。U-Sketchの中核となるのは、U-Netタイプの潜在エッジ予測器である。この予測器は、中間層の活性化を利用して、各脱ノイズステップでエッジマップを推定し、合成プロセスを指導する。
U-Sketchの主な特徴は以下の通り:
実験結果と、ユーザーからのフィードバックから、U-Sketchが優れた性能を発揮することが示された。
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Ilias Mitsou... kl. arxiv.org 03-28-2024
https://arxiv.org/pdf/2403.18425.pdfDybere Forespørgsler