核心概念
ユーザーの意図に沿って、リアルタイムで高品質な3D対応の肖像画編集を実現する
要約
本研究は、単一の肖像画から高品質で3D対応の編集を効率的に行う手法「3DPE」を提案する。
3D GANと大規模テキスト-画像モデルの知識を蒸留し、軽量なモジュールを構築することで、リアルタイムの編集を実現する。
参照画像やテキストプロンプトを用いて、様々な編集スタイルを1つのモデルで扱うことができる。
ユーザー定義のカスタマイズされた編集スタイルにも迅速に適応できる。
提案手法は、3D一貫性、プロンプトとの整合性、そして高速な推論速度を実現する。
統計
提案手法の推論時間は0.04秒であり、既存手法の100倍以上高速である。
提案手法は、入力画像のアイデンティティを0.47の精度で保持できる。
提案手法は、プロンプトとの整合性を0.73の精度で達成できる。
提案手法は、3D一貫性を0.76の精度で実現できる。
引用
"ユーザーの意図に沿って、リアルタイムで高品質な3D対応の肖像画編集を実現する"
"様々な編集スタイルを1つのモデルで扱うことができ、ユーザー定義のカスタマイズされた編集スタイルにも迅速に適応できる"