Das vorgestellte LLM3-Framework nutzt ein vortrainiertes großes Sprachmodell (LLM), um iterativ verfeinerte symbolische Aktionssequenzen und kontinuierliche Aktionsparameter zu generieren. Dabei berücksichtigt es Rückmeldungen des Bewegungsplaners, um Bewegungsversagen zu identifizieren und die Planung gezielt zu verbessern.
Im Gegensatz zu herkömmlichen Aufgaben- und Bewegungsplanungsansätzen, die manuelle, domänenspezifische Schnittstellen zwischen symbolischer Aufgabenplanung und kontinuierlicher Bewegungserzeugung erfordern, nutzt LLM3 das LLM als domänenunabhängige Schnittstelle. Das LLM schlägt Aktionssequenzen vor, generiert geeignete Aktionsparameter und analysiert Bewegungsversagen, um die Planung iterativ zu verbessern.
In Simulationsexperimenten zu einer Kisten-Verpackungsaufgabe zeigt LLM3 eine hohe Effektivität bei der Lösung von Aufgaben- und Bewegungsplanungsproblemen. Ablationsstudien unterstreichen den signifikanten Beitrag der Bewegungsversagensanalyse zum Erfolg von LLM3. Darüber hinaus wird die praktische Anwendbarkeit des Ansatzes in Experimenten mit einem physischen Manipulator demonstriert.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Shu Wang,Muz... at arxiv.org 03-19-2024
https://arxiv.org/pdf/2403.11552.pdfDeeper Inquiries