本論文では、ニューラル放射線フィールド(NeRF)の編集に焦点を当てている。NeRFは幾何学と質感の情報を暗黙的にエンコードしているため、編集が困難な課題となっている。
提案手法のLatentEditorは以下の特徴を持つ:
テキストプロンプトに基づいて、NeRFの局所的な編集を可能にする革新的なフレームワークを導入する。
デルタモジュールを提案し、InstructPix2Pixモデルを活用して、潜在空間内でのマスク生成を行う。これにより、編集対象領域を正確に特定できる。
NeRFを潜在空間内で直接トレーニングすることで、計算コストを大幅に削減し、編集の一貫性を維持する。
潜在空間での整合性を高めるためのリファイニングアダプタを導入する。これにより、レンダリングされた潜在特徴と元のシーンの潜在特徴の整合性が向上する。
提案手法は4つのベンチマークデータセットで評価され、既存手法と比較して、テキストフィデリティ、コンテンツ保持、シーン整合性の面で優れた性能を示している。また、ユーザー評価でも高い評価を得ている。
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Umar Khalid,... في arxiv.org 04-02-2024
https://arxiv.org/pdf/2312.09313.pdfاستفسارات أعمق