Основные понятия
PRIMEは、振る舞い原理を活用してタスクデモンストレーションを効率的に解析し、模倣学習のデータ効率性を向上させます。
Аннотация
PRIMEは、長期間のタスクで高いサンプル複雑性に苦しむ模倣学習アルゴリズムに対処するために設計されたフレームワークです。振る舞い原理を使用してロボットタスクを支援し、新しいタスクのためのポリシーを学習します。自己監督型データ収集手法を導入し、逆動力学モデル(IDM)でトレーニングデータセットを作成します。IDMは、行動原理から最適な原始系列を抽出するために使用されます。PRIMEはシミュレーションと実世界で評価され、他の模倣学習手法よりも優れたパフォーマンスを示します。
Статистика
PRIMEはマルチステージ操作タスクで10〜34%の成功率向上を達成
物理ハードウェア上では20〜48%の改善が観測される
Цитаты
"We present PRIME, a behavior primitive-based framework designed for improving the data efficiency of imitation learning."
"Our experiments demonstrate that PRIME achieves a significant performance improvement in multi-stage manipulation tasks."
"Recent work has explored using robotic behavior primitives to scaffold manipulation tasks."