Der Kern dieses Artikels ist die Entwicklung eines neuartigen Frameworks namens TryOn-Adapter für die virtuelle Anprobe von Bekleidung. Die Autoren identifizieren die Hauptprobleme bestehender diffusionsbasierter Methoden, nämlich die mangelnde Kontrolle über die Bekleidungsidentität und die ineffiziente Trainingsweise.
Um diese Probleme zu lösen, schlagen die Autoren einen Ansatz vor, der die Bekleidungsidentität in drei feinkörnige Faktoren unterteilt: Stil (Farbe und Kategorieinformationen), Textur (hochfrequente Details wie Muster, Logos und Text) und Struktur (glatte räumliche adaptive Transformation). Für jeden Faktor wird ein leichtgewichtiges, speziell angepasstes Modul entwickelt, das in den Diffusionsprozess injiziert wird, um eine präzise und effiziente Identitätskontrolle zu ermöglichen. Darüber hinaus führen die Autoren eine trainingsfreie Technik namens T-RePaint ein, um die Erhaltung der Bekleidungsidentität während der Inferenz weiter zu verbessern, ohne die realistische Anprobe-Wirkung zu beeinträchtigen.
Die Experimente auf zwei weit verbreiteten Datensätzen zeigen, dass unser Ansatz den aktuellen Stand der Technik übertrifft und gleichzeitig nur etwa die Hälfte der trainierbaren Parameter der jüngsten diffusionsbasierten Methoden verwendet.
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問