本論文では、一枚の参照画像から写実的な新規ビューを生成する一般化可能なニューラルレンダリングフィールドを提案する。既存の一般化可能なニューラルレンダリングフィールドは、参照画像に強く依存するため、ブラーが生じる問題がある。そこで、本手法は、GANモデルと事前学習済みのディフュージョンモデルを階層的に組み合わせることで、推論時のファインチューニングなしに、鮮明で魅力的な詳細を持つ新規ビューを生成する。
提案手法は、空間的に変化する近接照明条件下での鏡面反射のモデル化を改善することで、ニューラルレンダリングフィールドの性能を大幅に向上させる。