DOrA: Ein 3D-Bildverarbeitungsrahmen mit ordnungsbewusster Referenzierung für effiziente Objektlokalisierung
DOrA nutzt Großsprachmodelle, um eine Referenzreihenfolge von Ankergegenständen aus der natürlichen Beschreibung abzuleiten, um den Zielgegenstand in einer 3D-Punktwolkenszene effizient zu lokalisieren.