Der Artikel beschreibt einen Ansatz namens TWOSTEP, der klassische Planungsalgorithmen mit großen Sprachmodellen (LLMs) kombiniert, um Multiagenten-Aufgabenplanung effizienter zu gestalten.
Klassische Planungsformulierungen wie die Planning Domain Definition Language (PDDL) können zwar garantierte Aktionssequenzen zur Erreichung eines Zielzustands generieren, erfassen aber nicht die zeitlichen Aspekte des Handelns, wie z.B. dass zwei Agenten eine Aktion gleichzeitig ausführen können, wenn ihre Nachbedingungen sich nicht gegenseitig behindern.
Im Gegensatz dazu können LLMs zwar keine Ausführungsgarantien bieten, nutzen aber Alltagslogik, um Aktionssequenzen zusammenzustellen. TWOSTEP kombiniert die Stärken beider Ansätze, indem es LLMs nutzt, um eine teilweise unabhängige Teilaufgabe für einen Hilfsagenten zu identifizieren, die dieser parallel zum Hauptagenten ausführen kann. Dadurch wird die Gesamtausführungszeit reduziert, ohne die Erfolgsgarantie der klassischen Planung zu verlieren.
Der Artikel zeigt, dass TWOSTEP in symbolischen Domänen kürzere Ausführungspläne als ein einzelner Agent und kürzere Planungszeiten als direkte Multiagenten-PDDL-Planung erreichen kann. In einer simulierten Domäne erreicht TWOSTEP ähnliche Ausführungslängen wie ein einzelner Agent, ohne die hohen Planungszeiten von Multiagenten-PDDL in Kauf nehmen zu müssen.
翻譯成其他語言
從原文內容
arxiv.org
深入探究