本研究では、事前学習済みの潜在ディフュージョンモデル(LDM)を活用し、追加の訓練なしにスタイル転写を行うアルゴリズム「Style Tracking Reverse Diffusion Process (STRDP)」を提案している。
STRDPでは、LDMの逆拡散プロセスにおいて、スタイル画像の特徴マップの統計量をAdaptive Instance Normalization (AdaIN)関数を用いて、逐次的にコンテンツ画像の特徴マップに適用する。これにより、LDMの潜在空間でスタイル転写を実現できる。
提案手法は、既存のスタイル転写手法と比較して、追加の訓練を必要とせず、かつ高速に処理できるという特徴がある。また、LDMの変種モデルとの互換性も高く、様々な応用が期待できる。
実験の結果、提案手法はスタイル転写効果を保ちつつ、コンテンツ画像の色彩を維持できることが示された。ユーザースタディでも、色彩保持の点で高い評価を得ている。一方で、リバースディフュージョンステップ数を増やすことで、スタイル転写効果と元のコンテンツ保持のトレードオフが生じることも確認された。
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Kento Masui,... في arxiv.org 10-03-2024
https://arxiv.org/pdf/2410.01366.pdfاستفسارات أعمق