Vereinigung von 3D-Objekten: 3D-bewusste Bildausrichtung in freier Wildbahn
Unser Ziel ist es, eine kanonische 3D-Darstellung zusammen mit der Pose und einer dichten Karte der 2D-3D-Korrespondenz für jedes Bild in einer Sammlung zu erhalten. Wir entwickeln ein Framework, das die Erkenntnisse aus einem vortrainierten Text-zu-Bild-Generierungsmodell mit semantischen Informationen aus den Eingabebildern verschmilzt, um eine robuste 3D-Ausrichtung zu erreichen.