本研究では、3D対応の生成モデルEG3Dのトライプレーン表現を利用した参照ベースの画像編集手法を提案している。
まず、トライプレーン空間内で部位を自動的に特定するための手法を開発した。これにより、参照画像の特定の部位(目、口、髪など)を入力画像に忠実に転写することができる。
次に、トライプレーンの符号化と復号化を組み合わせた暗黙的な融合手法を提案した。これにより、部位の転写時に生じる不自然な境界を自然に補完することができる。
さらに、トライプレーンの符号化器を特化的に学習することで、色の一貫性や高周波成分の保持などの課題を解決した。
提案手法は、顔画像だけでなく動物の顔画像にも適用可能であり、カートゥーン風の参照画像からの部位転写も可能である。定量的・定性的な評価から、提案手法が既存手法を大きく上回ることが示された。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Bahri Batuha... lúc arxiv.org 04-05-2024
https://arxiv.org/pdf/2404.03632.pdfYêu cầu sâu hơn