Core Concepts
NeRFを高速にエンコーディングおよびデコーディングし、コンパクトなサイズを実現しつつ、高品質な新規ビュー合成を可能にする。
Abstract
本研究では、NeRFの高速エンコーディング・デコーディング、コンパクトサイズ、高品質な新規ビュー合成を目的とした「CodecNeRF」を提案する。
まず、エンコーダーとデコーダーの新しいアーキテクチャを設計し、単一の順伝播で NeRF 表現を生成できるようにした。さらに、パラメータ効率の良い微調整手法を開発し、初期の NeRF 表現を効率的に新しい対象物に適応させることで、高品質な画像レンダリングとコンパクトなコードサイズを実現した。
具体的には以下の手法を提案している:
3D特徴量の構築と圧縮
マルチ解像度のトライプレーン表現の生成
パラメータ効率の良い微調整手法(LoRA、テンソル分解)
エントロピーコーディングによる微調整デルタの圧縮
提案手法は、ShapeNetとObjaverseのデータセットで150倍の圧縮率と20倍の高速化を達成しつつ、高品質な画像レンダリングを維持することができた。これにより、NeRFの実用化に向けた新たな可能性が開かれると期待される。
Stats
提案手法は、ShapeNetデータセットの車クラスとチェアクラスで、150倍の圧縮率と20倍の高速化を達成した。
Objaverseデータセットでも同様の高い圧縮率と高速化を実現した。