Core Concepts
Ein neuartiger Ansatz zur effizienten Langzeit-Roboteraufgabenplanung, der Große Sprachmodelle und strukturierte Umgebungsrepräsentationen in Form von Szenen-Graphen nutzt, um komplexe Planungsprobleme zu lösen.
Abstract
Der Artikel präsentiert einen neuartigen Ansatz namens DELTA zur effizienten Langzeit-Roboteraufgabenplanung. DELTA kombiniert Große Sprachmodelle (LLMs) mit Szenen-Graphen als strukturierte Umgebungsrepräsentation, um komplexe Planungsprobleme zu lösen.
Der Ansatz besteht aus fünf Schritten:
- Domänengenerierung: Ein LLM generiert basierend auf einer natürlichsprachlichen Beschreibung eine formale Planungsdomäne in PDDL.
- Szenen-Graph-Bereinigung: Das LLM reduziert den Szenen-Graphen auf die für die Aufgabe relevanten Objekte, um die Komplexität zu verringern.
- Problemgenerierung: Basierend auf dem bereinigten Szenen-Graphen und einer natürlichsprachlichen Zielbeschreibung wird ein PDDL-Planungsproblem generiert.
- Zielzerlegung: Das LLM zerlegt das Langzeitziel in eine Sequenz von Teilzielen, um die Planung zu vereinfachen.
- Autoregressive Teilaufgabenplanung: Ein automatischer Planer löst die Teilprobleme nacheinander, um den Gesamtplan zu erhalten.
Im Vergleich zu bestehenden Ansätzen erzielt DELTA deutlich höhere Erfolgsquoten, kürzere Planungszeiten und eine effizientere Planung, insbesondere bei komplexen Langzeitaufgaben.
Stats
Die Roboteraufgabe kann in mehrere Teilaufgaben zerlegt werden, z.B.:
Cola-Dose entsorgen
Bananenschale entsorgen
Boden in der Küche wischen
Wischmopp in Spüle 1 reinigen
Boden im Wohnzimmer wischen
Wischmopp in Spüle 2 reinigen
Quotes
"DELTA first feeds scene graphs into LLMs to generate the necessary domain and problem specifications in formal planning language, then decomposes the long-term task goals into multiple sub-ones using LLMs."
"With the LLM-driven task decomposition strategy and the usage of formal planning language, compared to representative LLM-based baselines, DELTA is able to complete long-term tasks with higher success rates, near-optimal plan quality, and significantly shorter planning time."