本研究は、スケッチと参照画像を入力として、人物の幾何学と外観を分離して制御しながら高品質な人物画像を生成する手法を提案している。
まず、スケッチ画像エンコーダを訓練して、スケッチ入力を幾何学潜在コードに変換する。次に、StyleGAN-Humanの生成器を微調整して、幾何学潜在コードと外観潜在コードを組み合わせることで、スケッチの幾何学情報と参照画像の外観情報を統合した人物画像を生成する。
具体的には以下の手順で行う:
定性的・定量的な評価から、提案手法が既存手法に比べて優れた性能を示すことが確認された。また、ユーザスタディでも、幾何学保持、外観転移、画質、ユーザ嗜好の全ての側面で提案手法が最も高い評価を得た。
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Linzi Qu,Jia... ב- arxiv.org 04-25-2024
https://arxiv.org/pdf/2404.15889.pdfשאלות מעמיקות