Core Concepts
宇宙環境における不確定な条件に適応できる自律的なペグインホール組み立てを実現するために、手続き的生成とドメインランダム化を活用したアプローチを提案する。
Abstract
本研究では、宇宙ロボットの自律的なペグインホール組み立てを実現するための新しいアプローチを提案している。
手続き的生成を用いて、多様なペグとホールの組み合わせを生成し、並列シミュレーション環境で学習を行う。
ドメインランダム化を適用することで、エージェントの一般化能力を高める。
3つの強化学習アルゴリズム(PPO、SAC、DreamerV3)を評価し、それぞれの長所と短所を明らかにする。
時間依存性の影響を調べるため、観測履歴を活用するバリアントも検討する。
新しい組み立てシーケンスでの適応性を示すことで、提案手法の有効性を実証する。
宇宙環境における不確定な条件に適応できる自律的なロボットシステムの実現に向けて、重要な知見を提供する。
Stats
ペグとホールの間の隙間は1.0 mmに設定されている。
位置の観測誤差は標準偏差0.5 mm、姿勢の観測誤差は標準偏差1.0°である。
DreamerV3エージェントは、新しい組み立てシーケンスにおいて87.64%の成功率を達成した。
Quotes
"宇宙環境における不確定な条件に適応できる自律的なロボットシステムの実現に向けて、重要な知見を提供する。"
"手続き的生成を用いて、多様なペグとホールの組み合わせを生成し、並列シミュレーション環境で学習を行う。"
"ドメインランダム化を適用することで、エージェントの一般化能力を高める。"