Der Artikel präsentiert GF-NeRF, ein global-geführtes fokales neuronales Strahlungsfeld, das für die Darstellung großer Szenen entwickelt wurde. GF-NeRF teilt das Training großer Szenen in zwei Stufen auf: eine globale Stufe und eine fokussierte Stufe.
In der globalen Stufe wird ein Hash-Encoder verwendet, um eine grobe räumliche Darstellung der gesamten Szene zu erlernen. In der fokussierten Stufe wird die Szene dann in Blöcke unterteilt und neue Hash-Encoder werden verwendet, um detailliertere räumliche Darstellungen für jeden Block zu lernen.
Der entscheidende Aspekt ist, dass die räumlichen Informationen und Fehlerdaten aus der globalen Stufe die Ausbildung in der fokussierten Stufe leiten, so dass sich die zweite Stufe auf die Bereiche konzentriert, die von der globalen Stufe nicht gut behandelt wurden. Dadurch wird die Gesamtkapazität des NeRF erweitert, während die globale Konsistenz beibehalten wird.
Die Autoren zeigen, dass ihr Ansatz hochwertige, natürliche Renderingergebnisse auf verschiedenen Arten großer Datensätze erzielt, ohne Annahmen über die Zielszene zu treffen. GF-NeRF übertrifft dabei bestehende Methoden zur Darstellung großer Straßen- und Luftaufnahmen-Szenen.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Mingqi Shao,... lúc arxiv.org 03-20-2024
https://arxiv.org/pdf/2403.12839.pdfYêu cầu sâu hơn