この研究は、利用可能なまたは学習済みのモデルを使用して強化学習のデータ効率性を向上させるモデルベースの強化学習(MBRL)に焦点を当てています。提案された一歩戻りアプローチは、潜在空間モデルとポリシーを共同で学習し、サンプル効率の高い連続ロボティクス制御を実現します。具体的には、制御理論的知識が利用されて、進化したロボティクスモデルが正確に予測されますが、サンプル複雑さが低くなります。このインクリメンタル進化モデルは、高次元のロボット応用に特に有利なパラメトリック行列学習問題へと変換します。提案された一歩戻りアプローチの効率性を検証するために比較的数値シミュレーションが行われました。
Til et annet språk
fra kildeinnhold
arxiv.org
Viktige innsikter hentet fra
by Cong Li klokken arxiv.org 03-05-2024
https://arxiv.org/pdf/2403.01529.pdfDypere Spørsmål