Основные понятия
基盤モデル(FM)を活用して、ロボット軌道データを自動的に時間的に限定された自然言語ベースの記述的サブタスクに分解する。提案するフレームワークにより、時間ベースと言語ベースの両方の記述を生成し、自動ラベリングの品質を評価するための新しい指標を提供する。
Аннотация
本研究は、ロボット軌道データを自動的に分解し、言語ベースの記述を生成するためのフレームワークを提案している。
- 基盤モデル(FM)を活用して、ロボット軌道データを時間的に限定された自然言語ベースのサブタスクに分解する。
- 時間的整合性(τk)と意味的整合性(τζ)の2つの新しい指標を提案し、FM生成のサブタスク分解と人手ラベリングされた ground-truth との整合性を評価する。
- 4つの異なる環境で200本の軌道データを用いた実験結果から、提案手法が90%を超える高い整合性を示すことを確認した。
- この手法により、ロボットの Task and Motion Planning(TAMP)のための大規模で多様な言語ラベル付きデータセットの構築が可能になる。
Статистика
ロボット軌道の長さは約80ステップ
サブタスクの数は約5個
Цитаты
"Recent works in Task and Motion Planning (TAMP) show that training control policies on language-supervised robot trajectories with quality labeled data markedly improves agent task success rates."
"To address this concern, we present an automated framework to decompose trajectory data into temporally bounded and natural language-based descriptive sub-tasks by leveraging recent prompting strategies for Foundation Models (FMs) including both Large Language Models (LLMs) and Vision Language Models (VLMs)."