Automatische Rekonstruktion von Szenen mit einem autoreggressiven strukturierten Sprachmodell
Eine Methode, die direkt vollständige Szenenmodelle als Sequenz von strukturierten Sprachbefehlen unter Verwendung eines autoreggressiven, tokenbasierten Ansatzes vorhersagt.