Core Concepts
提案された拡散ベースのフレームワークは、シミュレーション環境と現実的な環境の間のグラスピングアクションにおける不一致を最小限に抑え、ロボットのグラスプタスクトレーニングを最適化します。
Abstract
I. INTRODUCTION
ロボティクスタスクで深層学習モデルが広範囲な注釈付きデータセットを必要とする課題に対処するため、Sim-to-Real戦略が開発されました。
GANsモデルは画像転送タスクで主要な技術フレームワークとして使用されます。
II. RELATED WORK
A. Visual Grasping
ビジョンベースのロボティックグラスピングは、3D環境の詳細な作成に焦点を当てています。
B. Image Generation Models for Bridging Reality Gap
GANs Models:
CycleGANやRetinaGANなどのGANsモデルが画像生成に革新をもたらしました。
Diffusion Models:
拡散モデルは訓練不安定性やモード崩壊といったGANsの問題に取り組んでいます。
C. Robotic Application
RetinaGANやRL-CycleGANなどの手法が視覚的グラスピングモデルの効果を向上させています。
III. METHODS
A. Robot Training and Robotic Control Pipeline
イメージ生成モデル部分とグラスピングエージェントネットワーク部分から構成されるパイプラインが存在します。
IV. EVALUATIONS
A. Datasets and Simulation Environment
画像生成モデルのトレーニング用にADE20KおよびCityscapesデータセットが使用されました。
B. Experiments in Image Generation
ALDMはゼロショットシムトゥリアル転送能力に優れています。
V. CONCLUSION & DISCUSSION
ALDM-Graspingフレームワークは、ゼロショットSim-to-Real転送で優れた性能を発揮しています。
Stats
提案されたフレームワークは75%の成功率を達成しました。このフレームワークは65%の成功率を維持しました。