本論文では、U-Sketchと呼ばれる新しいスケッチ指導型テキスト-画像合成フレームワークを提案している。U-Sketchの中核となるのは、U-Netタイプの潜在エッジ予測器である。この予測器は、中間層の活性化を利用して、各脱ノイズステップでエッジマップを推定し、合成プロセスを指導する。
U-Sketchの主な特徴は以下の通り:
実験結果と、ユーザーからのフィードバックから、U-Sketchが優れた性能を発揮することが示された。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Ilias Mitsou... lúc arxiv.org 03-28-2024
https://arxiv.org/pdf/2403.18425.pdfYêu cầu sâu hơn