Core Concepts
Ein neuartiges, generalisierbares 3D-Gaussian-Splatting-Verfahren wird vorgestellt, das eine effiziente und geometriebasierte Darstellung der Umgebung für Reinforcement Learning ermöglicht.
Abstract
Die Autoren präsentieren einen neuartigen Ansatz zur Verwendung von 3D-Gaussian-Splatting (3DGS) als Umgebungsrepräsentation für Reinforcement Learning (RL) Aufgaben. 3DGS bietet im Vergleich zu herkömmlichen Darstellungen wie Bilder, Punktwolken oder Voxel Vorteile, da es eine explizite, geometriebasierte und 3D-konsistente Repräsentation der Umgebung ermöglicht.
Der Kernaspekt des Ansatzes ist die Entwicklung eines generalisierbaren 3DGS-Moduls, das die 3D-Gaussian-Darstellung direkt aus Beobachtungsbildern vorhersagen kann, ohne eine aufwendige pro-Szene-Optimierung zu benötigen. Dieses Modul besteht aus drei Komponenten: einem Tiefenschätzer, einem Gaussian-Regressor und einem Gaussian-Verfeinerungsmodul.
Die Autoren evaluieren ihren Ansatz auf der RoboMimic-Plattform mit vier verschiedenen Aufgaben und drei RL-Algorithmen. Die Ergebnisse zeigen, dass die vorgeschlagene 3DGS-Repräsentation im Vergleich zu anderen expliziten Darstellungen wie Bilder, Punktwolken und Voxel insgesamt bessere Leistung erbringt und die Erfolgsquote auf der schwierigsten Aufgabe um 10%, 44% und 15% verbessert.
Stats
Die Erfolgsquote unseres Ansatzes ist im Vergleich zu anderen Darstellungen um 10%, 44% und 15% höher auf der schwierigsten Aufgabe.
Quotes
"Unser Ansatz ist der erste Versuch, generalisierbares 3DGS als Darstellung für RL zu verwenden."
"Die Ergebnisse zeigen, dass unsere Repräsentation insgesamt bessere Leistung erbringt als andere explizite Darstellungen."