Core Concepts
同期デュアルアームの再配置問題を協力的なmTSPとして定式化し、注意ベースの強化学習ポリシーとコスト予測子を導入してスケーラビリティ課題に対処する。
Abstract
同期デュアルアームの再配置は産業応用で一般的なシナリオとして広く研究されている。
ロボットアームの再配置の計算複雑性とデュアルアームプランニングの高次元性により、スケーラビリティ課題が生じる。
問題を協力的なmTSPとして定式化し、注意ベースのネットワークを使用して合理的なタスクスケジュールを提供する。
コスト予測子は行動評価を直接評価し、トレーニングと計画プロセスを大幅に加速する。
実験結果は、既存手法よりもパフォーマンスと計画効率の両方で優れていることを示している。
入力構造:
同期デュアルアーム再配置問題への取り組み(イントロダクション)
産業部門で柔軟かつ適応可能なシステムへの需要が高まっている。
同期デュアルアーム再配置は多くのタスクで頻繁に遭遇される。
デュアルアーム再配置問題への挑戦(背景)
デュアルアーム再配置は離散および連続推論を統合した計算複雑性がある。
上位レベルタスクスケジュールでは最適な行動シーケンス特定が目標。
現在のマルチロボットタスクおよび動作計画方法(関連作品)
MRTAMPメソッドは効率向上戦略を採用しているが、拡張性問題が依然として存在する。
提案手法:協力的mTSP(方法)
協力的mTSPに同期デュアルアーム再配置問題を形式化し、注意ベース強化学習ポリシーで解決する。
実験結果(実験および結果)
我々の手法は既存手法よりも優れたパフォーマンスを示す。訓練時に限られた数のタスクで訓練されても、大きな数に一般化し高品質なタスクスケジュール提供。
Stats
我々の手法は既存手法よりもパフォーマンスと計画効率が優れています。