本研究は、単一画像からの3Dポートレート再構築と3Dリエナクトメントの個別の限界を認識し、両者の長所を融合した新しい手法を提案している。
具体的には以下の通り:
単一画像からの3Dリフティング手法であるLP3Dを用いて、入力フレームから生の3Dトライプレーンを生成する。しかし、LP3Dは入力視点に依存し、側面からの入力では歪みや人物の同一性の喪失が見られる。
そこで、参照画像から事前に抽出した個人固有の3Dトライプレーン(トライプレーン・プライオア)を用いて、生成された3Dトライプレーンの歪みを補正する「トライプレーン・アンディストーター」モジュールを導入する。
さらに、補正された3Dトライプレーンとトライプレーン・プライオアを融合する「トライプレーン・フューザー」モジュールを導入する。これにより、個人の特徴を保ちつつ、入力フレームの動的な外観(表情、照明)を再現できる。
合成データを用いた学習により、時間的に一貫性のある高品質な3Dポートレートビデオを生成できる。
本手法は、単一画像からの3Dリフティングと3Dリエナクトメントの長所を融合し、時間的に一貫性のある動的な3Dポートレートの再構築を実現している。これにより、テレプレゼンスシステムの高品質化に貢献できると期待される。
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Wichtige Erkenntnisse aus
by Shengze Wang... um arxiv.org 05-03-2024
https://arxiv.org/pdf/2405.00794.pdfTiefere Fragen