Core Concepts
部分観測下でのソフトリストを使用したロボット組み立てにおいて、シンメトリーを活用することが効果的である。
Abstract
この研究は、ソフトリストを使用して代表的かつ難しい接触豊富なペグインホールタスクに取り組んでいます。従来の完全観測式フォーミュレーションではなく、部分観測式フォーミュレーションとディープ強化学習から記憶ベースエージェントを学習します。また、ドメインの対称性を活用してデータ拡張と補助損失を構築し、よりサンプル効率的な学習を実現します。提案されたエージェントは、5つの異なる対称ペグ形状でシミュレーションされた結果、既存のエージェントに匹敵するかそれ以上の性能を発揮しました。さらに、サンプル効率性により、3時間以内に実際のロボット上で直接学習することが可能です。
Stats
エージェントは5つの異なる対称ペグ形状でシミュレーションされた。
学習時間は3時間以内。
実際のロボット上で100回のデモンストレーションを使用して学習。