Core Concepts
ロボット間の協調的組立タスク計画のためのスタッケルバーグ型ゲーム理論的学習アプローチを提案する。リーダー-フォロワー型の相互作用を活用し、ロボット間の協調的な組立戦略を自動的に学習する。
Abstract
本研究では、複雑な組立タスクを効率的に完了するために、ロボット間の協調的な組立タスク計画を実現するアプローチを提案している。
まず、組立タスクを異なる能力を持つ2つのロボットが協調して完了するように、サブタスクに分解し、チェスボード表現を用いて可視化する。次に、ロボット間の協調プロセスをスタッケルバーグ型の確率的ゲームとして定式化し、スタッケルバーグ型の深層強化学習アルゴリズムを開発する。このアルゴリズムにより、ロボットは協調的な組立戦略を自動的に学習することができる。
シミュレーション実験の結果、提案手法は他の手法と比較して、組立タスクの完了時間が短く、ロボットの報酬も高いことが示された。さらに、提案手法は偶発的な環境変化や意図的な攪乱に対しても頑健性を示した。
Stats
ロボットLは個別サブタスクを90%の確率で完了できる
ロボットFは協調サブタスクを90%の確率で完了できる
個別サブタスクの報酬はrind=1、協調サブタスクの報酬はrcop=2、失敗の罰則はrcost=-1
Quotes
"ロボット間の協調的な組立タスク計画のためには、効率的で自動化された計画メカニズムが必要とされる。"
"スタッケルバーグ型ゲームは、ロボット間の階層的な相互作用を捉えるのに適した枠組みを提供する。"
"深層強化学習は、ロボットの協調的な組立戦略を自動的に学習するのに有効な手法である。"