Grunnleggende konsepter
大規模言語モデルを活用し、動的環境における人間の行動を予測することで、ロボットのタスク計画に人間の認知を組み込む。
Sammendrag
本論文は、大規模言語モデル(LLM)を活用して、ロボットのタスク計画に人間の認知を組み込む新しいアプローチを提案している。
まず、3Dシーングラフを用いて環境を表現し、人間をグラフ内のノードとして表現する。LLMを使って、過去の人間の行動観察に基づき、人間の今後の行動を予測する。
次に、予測された人間の行動を、人間をプランニングエージェントとして扱うマルチエージェントタスク計画問題に変換する。LLMを使って、人間の目標状態を形式的な計画言語で表現し、自動タスク計画手法を用いて、ロボットと人間の行動を統合的に計画する。
これにより、ロボットが人間の行動を考慮しつつ、自身のタスクを遂行できるようになる。本手法は、LLMを活用した人間認知型ロボットタスク計画の発展に寄与し、動的環境下でのロボットの主体的な意思決定を促進する。
Statistikk
人間は冷蔵庫の近くに立ち、冷蔵庫を向いている。
人間は過去に[麺、トマト、油、鍋]を集めている。