本論文は、NeRFアセットを直感的なイメージベースのワークフローで効率的に編集できる高速軽量なフレームワークProteusNeRFを提案している。
まず、NeRFをTriplaneLiteと呼ばれる効率的な表現に変換し、セマンティックな特徴抽出を行うことで、ユーザーが簡単に編集対象を選択できるようにする。次に、選択した領域に対して3D認識画像コンテキストを生成し、既存の画像編集ツール(従来型やジェネレーティブ)を使って編集を行う。最後に、この編集された画像コンテキストを元にNeRFを効率的に微調整することで、ビュー一貫性のある編集結果を得る。
このアプローチにより、外観変更は10秒、大規模な編集でも70秒と、従来手法に比べて10-30倍高速な編集が可能となる。また、編集結果は4-36KBと軽量で、レイヤー化された編集も可能である。
本手法は、NeRFの幾何学的変更、小規模な追加/削除、大規模な外観変更など、様々な編集に対応可能である。ユーザースタディの結果からも、提案手法が高い視覚一貫性と編集指示との整合性を示すことが確認された。
Para outro idioma
do conteúdo fonte
arxiv.org
Principais Insights Extraídos De
by Binglun Wang... às arxiv.org 04-24-2024
https://arxiv.org/pdf/2310.09965.pdfPerguntas Mais Profundas