Główne pojęcia
本研究では、効率的で効果的な仮想試着フレームワーク「TryOn-Adapter」を提案する。衣服のアイデンティティを細かな要素(スタイル、テクスチャ、構造)に分解し、それぞれに特化したモジュールを導入することで、衣服のアイデンティティを正確かつ効率的に制御できる。さらに、推論時に追加のコストをかけずに衣服アイデンティティを強化するT-RePaintを導入する。
Streszczenie
本研究の提案手法TryOn-Adapterは、仮想試着タスクにおける衣服アイデンティティの保持と効率的な学習を目的としている。
まず、衣服のアイデンティティを細かな3つの要素(スタイル、テクスチャ、構造)に分解し、それぞれに特化したモジュールを導入する。
スタイル保持モジュールでは、クラストークンとパッチトークンを組み合わせることで、衣服のカラーやカテゴリー情報を効果的に保持する。
テクスチャ強調モジュールでは、高周波特徴マップを活用して、衣服のパターンやロゴなどの細かなテクスチャ情報を強調する。
構造適応モジュールでは、ユーザフレンドリーな方法で生成した人体セグメンテーションマップを活用し、衣服の形状変化に適応する。
さらに、推論時にコストをかけずに衣服アイデンティティを強化するT-RePaintを導入する。
これらの工夫により、提案手法は既存の拡散モデルベースの手法と比べて、衣服アイデンティティの保持と生成画質の両立を実現している。
Statystyki
提案手法TryOn-Adapterは、既存の拡散モデルベースの手法と比べて、約半分の学習可能パラメータで最先端の性能を達成している。
提案手法は、VITON-HDデータセットにおいてFIDスコアを5.54まで改善し、既存手法を大きく上回る性能を示している。
Dresscodeデータセットでも、全ての評価指標において最高の結果を達成している。
Cytaty
"本研究では、効率的で効果的な仮想試着フレームワーク「TryOn-Adapter」を提案する。"
"衣服のアイデンティティを細かな要素(スタイル、テクスチャ、構造)に分解し、それぞれに特化したモジュールを導入することで、衣服のアイデンティティを正確かつ効率的に制御できる。"
"さらに、推論時に追加のコストをかけずに衣服アイデンティティを強化するT-RePaintを導入する。"