Ein robotisches multimodales Wahrnehmungs- und Planungsframework mit multimodalen Großsprachmodellen
RoboMP2 ist ein neuartiges robotisches multimodales Wahrnehmungs- und Planungsframework, das eine zielgerichtete multimodale Wahrnehmung (GCMP) und eine abrufgestützte multimodale Planung (RAMP) kombiniert, um die Wahrnehmungs- und Planungsfähigkeiten von Robotern zu verbessern.