Core Concepts
大規模言語モデルを使ったハウスキーピングロボットの個人設定を改善するための最適化パイプラインを提案する。
Abstract
本論文では、大規模言語モデル(LLM)を使ったハウスキーピングロボットの個人設定を改善するための最適化パイプラインを提案している。
まず、LLMプランナーの入力コンテキストの解釈と実行可能な計画の生成を改善するために、模倣学習を使ってモデルをブートストラップする。次に、対話的な自己学習を通じて、ユーザーの好みに合わせてLLMプランナーを最適化する。
具体的には以下の通り:
コンテキストジェネレータは、ロボットの観察に基づいて、部屋、受容体、オブジェクトの情報を含むグラフを維持・更新する。
LLMプランナーは、このグラフを入力として、高レベルの行動計画を生成する。各高レベル行動は低レベルの制御行動に変換され、コントローラーによって実行される。
最適化パイプラインでは、まず模倣学習によってLLMプランナーをブートストラップし、入力コンテキストの解釈と実行可能な計画の生成を改善する。
その後、対話的な自己学習を通じて、ユーザーの好みに合わせてLLMプランナーを最適化する。
実験では、Housekeepベンチマークを使って評価を行い、提案手法が既存手法に比べて30%以上の成功率の向上を示した。また、計画の実行可能性や探索と活用のバランスなどの分析も行っている。
Stats
提案手法(LLM-Personalize)は、既存手法に比べて30%以上の成功率の向上を示した。
模倣学習によってLLMプランナーの実行可能性が大幅に改善された。
自己学習によって、探索と活用のバランスが改善された。
Quotes
"LLM-Personalize, a household robotics agent framework with an LLM-based architecture capable of performing long-horizon planning in multi-room, partially observable household scenarios, and an optimisation pipeline designed to personalize the LLM planner according to user preferences."
"Our model achieves superior alignment with user preferences, outperforming existing work in the challenging Housekeep rearrangement tasks."