本研究の提案手法TryOn-Adapterは、仮想試着タスクにおける衣服アイデンティティの保持と効率的な学習を目的としている。
まず、衣服のアイデンティティを細かな3つの要素(スタイル、テクスチャ、構造)に分解し、それぞれに特化したモジュールを導入する。
スタイル保持モジュールでは、クラストークンとパッチトークンを組み合わせることで、衣服のカラーやカテゴリー情報を効果的に保持する。
テクスチャ強調モジュールでは、高周波特徴マップを活用して、衣服のパターンやロゴなどの細かなテクスチャ情報を強調する。
構造適応モジュールでは、ユーザフレンドリーな方法で生成した人体セグメンテーションマップを活用し、衣服の形状変化に適応する。
さらに、推論時にコストをかけずに衣服アイデンティティを強化するT-RePaintを導入する。
これらの工夫により、提案手法は既存の拡散モデルベースの手法と比べて、衣服アイデンティティの保持と生成画質の両立を実現している。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Jiazheng Xin... at arxiv.org 04-02-2024
https://arxiv.org/pdf/2404.00878.pdfDeeper Inquiries