PRIMEは、長期間のタスクで高いサンプル複雑性に苦しむ模倣学習アルゴリズムに対処するために設計されたフレームワークです。振る舞い原理を使用してロボットタスクを支援し、新しいタスクのためのポリシーを学習します。自己監督型データ収集手法を導入し、逆動力学モデル(IDM)でトレーニングデータセットを作成します。IDMは、行動原理から最適な原始系列を抽出するために使用されます。PRIMEはシミュレーションと実世界で評価され、他の模倣学習手法よりも優れたパフォーマンスを示します。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Tian Gao,Sor... at arxiv.org 03-05-2024
https://arxiv.org/pdf/2403.00929.pdfDeeper Inquiries