Core Concepts
制御理論的知識を活用して、サンプル効率の高い連続ロボティクス制御を実現するための一歩戻りアプローチを提案する。
Abstract
この研究は、利用可能なまたは学習済みのモデルを使用して強化学習のデータ効率性を向上させるモデルベースの強化学習(MBRL)に焦点を当てています。提案された一歩戻りアプローチは、潜在空間モデルとポリシーを共同で学習し、サンプル効率の高い連続ロボティクス制御を実現します。具体的には、制御理論的知識が利用されて、進化したロボティクスモデルが正確に予測されますが、サンプル複雑さが低くなります。このインクリメンタル進化モデルは、高次元のロボット応用に特に有利なパラメトリック行列学習問題へと変換します。提案された一歩戻りアプローチの効率性を検証するために比較的数値シミュレーションが行われました。
Stats
提案された一歩戻りアプローチは、サンプル効率の優れた連続ロボティクス制御問題で数値シミュレーションが行われました。
Quotes
"Model based reinforcement learning (MBRL) attempts to use an available or a learned model to improve the data efficiency of reinforcement learning."
"The formulated incremental evolution model accurately predicts the robotics movement but with low sample complexity."
"The imagined data from the learned incremental evolution model is used to supplement training data to enhance the sample efficiency."