画像ベースの仮想試着(VTON)は、高い忠実度と衣服の詳細な保存を求める難しい画像合成タスクであり、OOTDiffusionはこの問題に取り組む。提案されたOOTDiffusionは、事前学習された潜在拡散モデルの力を活用し、現実的かつコントロール可能な仮想試着を実現するための新しいネットワークアーキテクチャである。具体的には、衣服の詳細な特徴を学習し、それらを情報損失がほとんどないようにデニングUNetに統合するためのアウトフィッティング融合プロセスを導入している。さらに、訓練中のアウトフィッティングドロップアウトにより、衣服特徴に対する分類器フリーガイダンスが可能となり、VTON手法のコントロール性能が向上している。
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Yuhao Xu,Tao... في arxiv.org 03-05-2024
https://arxiv.org/pdf/2403.01779.pdfاستفسارات أعمق