Core Concepts
効果的な物体操作を可能にする混雑した環境での押し引きポリシーの開発
Abstract
ロボットは周囲の物体から干渉を受けるため、目標物体をつかむ際に課題が生じる。
深層強化学習(DRL)手法を提案し、押し引きの共同ポリシーを開発して、未訓練で密集した環境内で目標物体を効果的に操作する。
二重RLモデルが導入され、複雑なシーンを処理する高い耐性が示され、シミュレーションおよび実世界シーンで平均98%のタスク完了率に達成。
シミュレーション実験と実世界テストにより、提案手法の評価を行い、我々のアプローチの堅牢性を確認。
実験結果は、最近の最先端手法を上回り、提案手法の優れた効果を強調している。
導入(Introduction)
ロボットはグラスピングが基本的であり、人間と同様に動作原理(押すなど)を使用して目標物体を分離する必要がある。
効果的なグラスピングでは視覚観察と空間関係の理解が必要。
関連作業(Related Work)
自律グラスピングは急速に進歩しており、伝統的な方法からディープラーニングやデータ駆動型方法へ移行している。
方法(Method)
カメラは場面を捉えて直交投影画像生成し、360°回転させてグラスプとプッシュ方向を学習。
提案手法はXuら[15]と異なり特定マスクだけでなく全Q値も評価し採用。
実験(Experiment)
シミュレーション実験ではCoppeliasimおよびGazeboでテスト。提案手法はCoppeliasimでトレーニング後Gazeboで微調整された。
家庭用オブジェクトエキスパートでも我々アプローチは他者よりも優れたGSとC% を達成。
結論および今後の展望(Conclusion and Future Work)
自己監督DRLアプローチは未訓練および高度に混雑した環境下で目標物体をつかむことが可能。今後はカリキュラム学習などさらなる改善が見込まれる。
Stats
提案手法は平均98%のタスク完了率達成。
二重RLモデルが複雑なシーンでも高い耐性示す。