この研究は、利用可能なまたは学習済みのモデルを使用して強化学習のデータ効率性を向上させるモデルベースの強化学習(MBRL)に焦点を当てています。提案された一歩戻りアプローチは、潜在空間モデルとポリシーを共同で学習し、サンプル効率の高い連続ロボティクス制御を実現します。具体的には、制御理論的知識が利用されて、進化したロボティクスモデルが正確に予測されますが、サンプル複雑さが低くなります。このインクリメンタル進化モデルは、高次元のロボット応用に特に有利なパラメトリック行列学習問題へと変換します。提案された一歩戻りアプローチの効率性を検証するために比較的数値シミュレーションが行われました。
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Cong Li alle arxiv.org 03-05-2024
https://arxiv.org/pdf/2403.01529.pdfDomande più approfondite