Eine Methode, die direkt vollständige Szenenmodelle als Sequenz von strukturierten Sprachbefehlen unter Verwendung eines autoreggressiven, tokenbasierten Ansatzes vorhersagt.
Ein neuartiges Verfahren zur Rekonstruktion vollständiger Oberflächen für verborgene Teile von Objekten, das ein vortrainiertes Diffusionsmodell zur Auffüllung der verborgenen Bereiche in 2D-Bildern verwendet.
Wir präsentieren D-SCo, ein neuartiges zentrumsgesteuertes bedingtes Diffusionsmodell, das die Unsicherheiten, die durch Hand- und Selbstverdeckung entstehen, effizient modelliert und die Leistung bei der Rekonstruktion von handhaltenen Objekten aus monokularen Bildern deutlich verbessert.