本論文では、一枚の参照画像から写実的な新規ビューを生成する一般化可能なニューラルレンダリングフィールドを提案する。既存の一般化可能なニューラルレンダリングフィールドは、参照画像に強く依存するため、ブラーが生じる問題がある。そこで、本手法は、GANモデルと事前学習済みのディフュージョンモデルを階層的に組み合わせることで、推論時のファインチューニングなしに、鮮明で魅力的な詳細を持つ新規ビューを生成する。