核心概念
古典的な計画問題定義言語(PDDL)では、複数のエージェントが同時に行動できる時間的側面を捉えられない。一方、Large Language Modelsを使った直接的な計画生成では成功保証がない。本研究では、LLMの常識推論能力を活用して、2つのエージェントの部分的に独立した部分目標を見つけ出し、それぞれのエージェントが単独で計画を立てることで、計画時間を短縮しつつ、計画実行時間も短縮できることを示す。
要約
本研究では、古典的な計画問題定義言語(PDDL)と大規模言語モデル(LLM)の長所を組み合わせた手法「TWOSTEP」を提案する。
TWOSTEPでは、まず、LLMを使ってヘルパーエージェントの部分目標を推定する。この部分目標は、メインエージェントの行動と独立して実行できるものである。次に、ヘルパーエージェントの部分目標をPDDLの目標条件に変換し、メインエージェントの計画問題に組み込む。これにより、メインエージェントは部分的に解決された状態から計画を立てることができ、全体の計画時間とプラン実行時間が短縮される。
実験では、5つの記号的なドメインと1つのシミュレーション環境で評価を行った。結果、TWOSTEPは、単一エージェントのPDDL計画よりも短いプラン実行時間を達成し、かつ、複数エージェントのPDDL計画よりも短い計画時間を実現できることが示された。また、LLMによる部分目標の推定は、人間専門家が指定した部分目標とほぼ同等の性能を発揮することが分かった。
統計
単一エージェントのPDDL計画の平均プラン実行長は60.9ステップ
複数エージェントのPDDL計画の平均プラン実行長は57.4ステップ
TWOSTEPの平均プラン実行長は59.3ステップ
単一エージェントのPDDL計画の平均計画時間は569.3秒
複数エージェントのPDDL計画の平均計画時間は663.4秒
TWOSTEPの平均計画時間は563.7秒