核心概念
人間の学習方法に着想を得て、ERP-BPNNは多様なロボット間で効果的な学習とスキルトランスファーを可能にする。
要約
人間の脳や行動は、ロボティクスのための新しい制御および学習手法にインスピレーションを提供します。ERP-BPNNは、双方向プログレッシブニューラルネットワーク(BPNN)とソフトエピソードリターンプログレスト(ERP)メカニズムを組み合わせた新しいマルチタスク強化学習アプローチです。このフレームワークは、BPNNアーキテクチャが効果的な双方向スキルトランスファーを可能にし、動的なタスク選択用のソフトERPメカニズムを組み込んでいます。ERP-BPNNは、Episodic Return Progress(ERP)に基づくタスク選択手法が成功裏に多様なメトリックで優れたパフォーマンスを達成しています。
統計
エピソード数:100,000回
期待される目標までの距離:1.29 ± 0.18(最小値)
最短経路からの逸脱:13.94 ± 0.27(最小値)
引用
"Developmental learning offers some inspiration: during learning, an infant autonomously decides what to do or play without external directions dictating what task (s)he needs to engage in."
"Inspired from the above discussion, we aim to develop a multi-task reinforcement learning (RL) framework with autonomous task switching."
"The proposed ERP-BPNN enjoys positive skill transfer and thus continues to improve its progress."